Skip to main content

Full text of "Éléments de Mathématiques Appliquées"

See other formats


2013 


Opéra Magistris 

Éléments de mathématiques appliquées 

3 eme édition revue et corrigée (draft 2.18) 

La science au cœur des savoirs, toutes disciplines confondues: des mathématiques à 
la médecine, de l'astrophysique à l'histoire des sciences- 


Vincent ISOZ 
Sciences.ch 
11 août 2018 




















Les opinions émises dans cet ouvrage n'engagent que son rédacteur 



\ 

F 

DANGER 

if 

La copie permet 

f 

- m 1 l'accès pour tous 

l 

1 à la connaissance 

V h 

* J J et favorise 

\ 

~ J ~ l'innovation 


__ J 


Le pictogramme qui figure ci-contre mérite une explication. Son 
objet est d'alerter le lecteur sur la menace que représente pour 
l'avenir de l'écrit et de la connaissance le développement massif du 
brevetage et du droit à la propriété intellectuelle à tout va. 


Toute reproduction partielle ou totale du présent support électronique est fortement 
recommandée (évitez le papier quand même pour des raisons écologiques évidentes...) sans 
autorisation de l'auteur. 

Le concept de propriété intellectuelle est un crime contre l'humanité...! 


Pour les personnes souhaitant citer le présent document dans leurs travaux voici si besoin un 
exemple inspiré de la norme ISO 690/AFNOR: 


ISOZ Vincent , Éléments de mathématiques appliquées, Lausanne, Éd. Privées, 
2012, 3 ème version, (l ère version 2001, 2 ème version 2005), 729 p„ 1*897 nb p„ 
PDF, 21x29.7 cm (ISBN 978-2-8399-0932-7) 


Nouvelle présentation 
Édition Privée Sciences.ch 
22 Chemin de Chandieu - 1006 Lausanne - Suisse 



Avant d'imprimer, pensez à l'environnement 


Le code de la propriété intellectuelle ne s'applique en aucun cas sur le contenu de ce document quels que soient 
les avis divergents des différents auteurs du présent PDF. Toute représentation ou reproduction du présent 
document par quelque procédé que ce soit constitue un pas vers l'acquisition de la connaissance motivée par les 
auteurs au droit de tout à chacun d'accéder à l'information. 


ISBN 978-2-8399-0932-7 


27 



782839 




























Vincent ISOZ [v3.0 - 2013] 


[SCIENCES.CH] 

TABLE DES MATIÈRES 


Introduction.1 

Méthodes .5 

Méthode de Descartes.9 

Vocabulaire . 10 

Sur les sciences.10 

Terminologie.12 

Science et foi.14 


| Arithmétique. 

. 17 I 

Théorie de la démonstration . 

. 17 

- La criue dey fondement . 18 - 


Paradoxes. 

Raisonnement hypothético-déductif. 

Calcul propositionnel. 

Propositions. 

Connecteurs. 

Procédures de décision. 

Procédures de décisions non axiomatisées. 

Procédures de décisions axiomatisées. 

Quantificateurs. 

Calculs des prédicats. 

Grammaire. 

Langages. 

Symboles. 

Termes. 

Formules. 

Démonstrations. 

Règles de démonstration. 


.21 

.22 

.23 

.23 

.25 

.31 

.32 

.32 

.36 

.36 

.37 

.37 

.38 

.39 

.41 

.44 

.45 


Nombres (scalaires). 


.59 


Bases numériques. 

Types de nombres. 

Nombres entiers (nombres naturels).... 

Axiomes de Peano. 

Nombres pairs, impairs, et parfaits , 

Nombres premiers. 

Nombres entiers relatifs. 

Nombres rationnels. 

Nombres irrationnels. 

Nombres réels. 

Nombres transfinis. 

Nombres complexes. 

Interprétation géométrique. 

Plan de Gauss. 

Formule d'Euler. 

Vecteur tournant. 

Transformations dans le plan. 


.63 

.63 

.65 

.66 

.66 

.67 

.69 

.71 

.73 

.75 

.78 

.84 

.84 

.86 

.88 

.89 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 



























































Vincent ISOZ [v3.0 - 2013] 


[SCIENCES.CH] 


Nombres quaternions.94 

Nombres algébriques.110 

Nombres transcendants.111 

Nombres abstraits.112 

Alphabet Grec.112 

_ Domaine de définition.113 

Opérateurs . 120 

Relations binaires.120 

Égalités.121 

Comparateurs.122 

Relations binaires réflexives, symétriques, antisymétriques.124 

Classes d'équivalences.125 

Lois fondamentales de l'arithmétique.128 

Addition.129 

Soustraction.131 

Multiplication.133 

Division.136 

Polynômes arithmétiques.141 

Valeur absolue.141 

Règles de calcul.143 

Théorie des nombres . 152 

Principe du bon ordre.152 

Principe d'induction.153 

Divisibilité.155 

Division euclidienne.156 

Plus grand commun diviseur (P.G.C.D).161 

Algorithme d'Euclide.162 

Plus petit commun multiple (P.P.C.M.).165 

Théorème fondamental de l'arithmétique.167 

Congruences.168 

Classes de congruences.171 

Fractions continues.174 

Théorie des ensembles . 187 

Axiomes de ZF (Zermelo-Frankel).191 

Cardinaux.197 

Produit cartésien.199 

Bornes.200 

Opérations ensemblistes.201 

Inclusion.201 

Intersection.202 

Réunion/Union.203 

Différence.205 

Différence symétrique.205 

Produit.206 

Complémentarité.206 

Fonctions et applications.208 

Loi de composition.209 

Loi inteme/externe.209 

Image et noyau.209 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 













































































Vincent ISOZ [v3.0 - 2013] 


[SCIENCES.CH] 


Fonction surjective.210 

Fonction injective.211 

Fonction bijective.212 

Fonction composée.213 

Théorème de Cantor-Bernstein.213 

Structures.216 

Magma.218 

Monoïdes.218 

Groupes.221 

Groupe abélien.221 

Groupe cyclique.221 

Anneaux.226 

Anneau abélien (commutatif).227 

Anneau intègre.227 

Anneau factoriel.227 

Sous-anneau.229 

Corps .229 

Corps commutatif.229 

Espaces vectoriels.231 

Sous-espaces vectoriels.233 

Algèbres.233 

Homomorphismes.234 

Homomorphisme de magma.234 

Homomorphisme de monoïde.234 

Homomorphisme d'anneau.234 

Homomorphisme de groupe.235 

Homomorphisme de corps.236 

Isomorphisme.237 

Endomorphisme.237 

Automorphisme.237 

Idéal.237 

Probabilités . 246 

Univers des événements.246 

Axiomatique de Kolmogorov.248 

Événements disjoints.248 

Événements équiprobables.249 

Événements conjoints.250 

Probabilités conditionnelles.254 

Formule des probabilités composées.256 

Formules de Bayes.257 

Espérance conditionnelle.259 

Réseaux bayésiens.262 

Martingales.274 

Analyse combinatoire.276 

Arrangements simples avec répétition.276 

Permutations simples sans répétition.278 

Permutations simples avec répétition.279 

Arrangements simples sans répétition.280 

Combinaisons simples.281 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 




























































Vincent ISOZ [v3.0 - 2013] 


[SCIENCES.CH] 


Coefficient binomial.281 

Formule de Pascal.282 

Chaînes de Markov.283 

Types de processus stochastiques.284 

Matrice de transition.284 

Statistiques . 292 

Echantillons.294 

Moyennes.294 

Moyenne arithmétique.295 

Médiane.297 

Moyenne quadratique.305 

Moyenne harmonique.306 

Moyenne géométrique.306 

Moyenne mobile/glissante.307 

Moyenne pondérée.309 

Moyenne fonctionnelle.309 

Lissage de Laplace.309 

Propriété des moyennes.311 

Types de variables.316 

Variables discrètes.316 

Fonction de répartition.317 

Espérance discrète.318 

Déviation standard discrète.320 

Relation de Huyghens.323 

Variable centrée réduite.325 

Covariance discrète.326 

Espérance et variance de la moyenne (erreur standard et fcp).331 

Coefficient de corrélation.333 

Variables continues.340 

Densité de probabilité.337 

Espérance contfinue.338 

Variance continue.338 

Postulat fondamental de la statistique.338 

Indice de diversité.339 

Fonctions de distribution.341 

Fonction discrète uniforme.342 

Fonction de Bernoulli.344 

Fonction géométrique.345 

Fonction binomiale.348 

Fonction binomiale négative.355 

Fonction hypergéométrique.359 

Fonction multinomiale.365 

Fonction de Poisson.372 

Fonction de Gauss-Laplace.375 

Somme de deux v.a. normales.382 

Produit de deux v.a. normales.383 

Loi normale centrée réduite.385 

Droite de Henry.386 

Diagramme quantile-quantile.390 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


IV 





























































Vincent ISOZ [v3.0 - 2013] 


[SCIENCES.CH] 


Fonction log-normale.391 

Fonction uniforme continue.395 

Fonction triangulaire.398 

Fonction de Pareto.401 

Fonction exponentielle.407 

Fonction de Cauchy.409 

Fonction bêta.412 

Fonction Gamma.415 

Fonction de Khi-Deux.420 

Fonction de Student.424 

Fonction de Fisher-Snedecor.429 

Fonctions de Benford.431 

Estimateurs de vraisemblance.436 

Estimateurs de la loi Normale.437 

Estimateurs de la loi de Poisson.441 

Estimateurs de la loi Binomiale (et géométrique).442 

Estimateurs de la loi de Weibull.443 

Estimateurs de la loi Gamma.446 

Facteur de correction sur population finie.447 

Intervalles de confiance.450 

I.C. sur la moyenne avec variance théorique connue (test Z).451 

I.C. sur la variance avec moyenne théorique connue.455 

I.C. sur la variance avec moyenne empirique connue (test du Khi-2).460 

I.C. sur la moyenne avec variance empirique connue (test-T).461 

Test binomial exact.465 

I.C. pour une proportion.468 

Test de l'égalité de deux proportions.471 

Test des signes.473 

Test de la médiane de Mood.476 

Test de Poisson (à un échantillon).479 

Test de Poisson (à deux échantillons).479 

Intervalle de confiance/tolérance/prédiction.481 

Loi faible des grands nombres.483 

Inégalité de Markov.484 

Inégalité de Bienaymé-Tchebychev.484 

Fonction caractéristique.488 

Théorème central limite.492 

Tests d'hypothèses et d'adéquation.498 

Orientation du test d'hypothèse.501 

Puissance d'un test.506 

Puissance du test Z à 1 échantillon.507 

Puissance du test p à 1 et 2 échantillons.510 

Analyse de la variance (ANOVA à 1 facteur).511 

Test de Fisher.514 

Test-t homoscédastique (test d'égalité de moyennes avec variances égales).520 

Test-t hétéroscédastique (test d'égalité de moyennes avec variances non égales).521 

Analyse de la variance (ANOVA à deux facteurs sans répétition).525 

Analyse de la variance (ANOVA à deux facteurs avec répétition).539 

ANOVA multifactorielle à mesures répétées.545 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


V 























































Vincent ISOZ [v3.0 - 2013] 


[SCIENCES.CH] 


Test C de Cochran.546 

Test d'ajustement du Khi-2.549 

Test d'ajustement de Kolmogorov-Smirnov.553 

Test de normalité de Ryan-Joiner.559 

Robustesse.563 

Statistiques de rangs.564 

Tests de rangs (non paramétriques).564 

L-Statistiques.568 

Test de la somme des rangs de Wilcoxon.569 

Test de la somme des rangs signés de Mann-Withney.579 

Traitement des égalités.585 

Test de la somme des ranges signés de Wilcoxon pour 1 échantillon.587 

Test de la somme des rangs signés de Wilcoxon pour 2 échantillons appariés .590 

Test de Kruskal-Wallis.592 

Test de Friedman.596 

Statistiques des valeurs extrêmes (basées sur les rangs).599 

Test de l'étendue de Tukey.603 

Coefficient de corrélation des rangs de Spearman.606 

Calculs d'erreurs.610 

Incertitudes relatives et absolues.610 

Erreurs statistiques.611 

Répétabilité.613 

Propagation des erreurs.614 

Chiffres significatifs.615 


|| Algèbre. 

.621 I 

Calcul algébrique . 

. 622 


Équations. 

Inéquations. 

Identités remarquables. 

Triangle de Pascal. 

Binôme de Newton. 

Polynômes. 

Division euclidienne des polynômes. 

Théorème de factorisation des polynômes. 

Équations diophantiennes. 

Polynômes de degré 1. 

Polynômes de degré 2. 

Discriminant. 

Relations de Viète. 

Nombre d'or. 

Polynômes de degré 3. 

Polynômes de degré 4. 

Polynômes trigonométriques. 

Polynômes cyclotomiques. 

Polynômes de Legendre. 


.624 

.626 

.631 

.633 

.633 

.635 

.637 

.638 

.640 

.640 

.641 

.642 

.643 

.646 

.646 

.650 

.652 

.653 

.654 


Algèbre ensembliste . 664 


Algèbre et géométrie corporelle.664 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


VI 






























































Vincent ISOZ [v3.0 - 2013] 


[SCIENCES.CH] 


Groupes cycliques.665 

Groupe des racines de l'unité.666 

Groupe des transformations.668 

Groupe linéaire.668 

Groupe des transformations affines.668 

Groupe spécial linéaire.670 

Groupe orthogonal.670 

Groupe cercle.671 

Groupe unitaire.671 

Groupe spécial linéaire.672 

Groupes de symétries.675 

Groupe diédral.677 

Orbite et stabilisateur.678 

Groupe des permutations.679 

_ Groupe alterné.685 

Calcul différentiel et intégral . 690 

Calcul différentiel.690 

Pente moyenne.690 

Dérivée première.691 

Fonction dérivée.691 

Point d'inflexion.692 

Théorème de Rolle.694 

Théorème des accroissements finis.695 

Règle de l'Hospital.696 

Différentielles.697 

Différentielles partielles.699 

Différentielle totale exacte.699 

Différentielle totale inexacte.702 

Théorème de Schwarz.702 

Dérivées usuelles.705 

Dérivée d'une somme.709 

Dérivée d'un produit.709 

Formule de Leibniz.709 

Dérivée d'une fonction composée.712 

Dérivée d'un quotient.714 

Calcul intégral.718 

Intégrale définie.718 

Intégrale de Riemann.719 

Somme de Darboux.720 

Intégrale indéfinie.724 

Théorème fondamental du calcul intégral.725 

Relation de Chasles.730 

Intégrale double.730 

Théorème de Fubini.733 

Intégration par changement de variable.734 

Jacobien.738 

Matrice j acobienne.738 

Intégration par parties.741 

Primitives usuelles.742 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


VII 





























































Vincent ISOZ [v3.0 - 2013] 


[SCIENCES.CH] 


Fonction de Dirac.764 

Fonction Gamma d'Euler.765 

Expression de la factorielle.767 

Constante d'Euler-Mascheroni.768 

Intégrales curvilignes.769 

Intégrale curviligne d'un champ scalaire.769 

Intégrale curviligne d'un champ vectoriel.771 

Champ conservatif.771 

Equations différentielles.774 

Équations différentielles du 1 er ordre.775 

Équations différentielles d'ordre 1 à variables séparées.775 

Équations différentielles linéaires (E.D.L).775 

Équations homogène ESSM.776 

Méthode du polynôme caractéristique.777 

Résolution de l'équation homogène de l'E.D.L à coefficients constants d'ordre 1.777 

Résolution de l'équation homogène de l'E.D.L à coefficients non constants d'ordre 1.778 

Résolution de l'équation homogène de l'E.D.L à coefficients non constants d'ordre 2.779 

Méthode du facteur intégrant (d'Euler).785 

Méthode de séparation des variables.787 

Méthode de variation de la constante.788 

Systèmes d'équations différentielles.790 

Méthode régulière des perturbations.790 

Théore perturbative des équations algébriques.795 

_ Théorie perturbative des équations différentielles.795 

Suites et séries . 806 

- Suites.806 

Suites arithmétiques.807 

Suites harmoniques.809 

Suites géométriques.810 

Suite de Cauchy.811 

Suite de Fibonacci.814 

Séries.815 

Série numérique.815 

Série de Gauss.816 

Nombres et polynômes de Bernoulli.820 

Séries arithmétiques.825 

Séries géométriques.826 

Fonction zêta et identité d'Euler.827 

Séries de Taylor et de MacLaurin.831 

Série de Maclaurin.832 

Série de Taylor.833 

Développements de Maclaurin usuels.836 

Séries de Taylor d'une fonction à 2 variables.844 

Forme quadratique.846 

Reste de Lagrange.848 

Formule de Taylor avec reste intégral.850 

Séries de Fourier.851 

Coefficients de Fourier.857 

Phénomène de Gibbs.869 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 






























































Vincent ISOZ [v3.0 - 2013] 


[SCIENCES.CH] 


Puissance d'un signal.871 

Théorème de Parseval.871 

Transformée de Fourier.872 

Séries de Bessel.880 

Fonction de Bessel d'ordre 0.880 

Fonction de Bessel d'ordre N.886 

Equation différentielle de Bessel d'ordre N.886 

Critères de convergence.887 

Test de l'intégrale.887 

Règle d'Alembert.888 

Règle de Cauchy.888 

Théorème de Leibniz.889 

Convergence absolue.889 

_ Théorème du point fixe.890 

Calcul vectoriel . 897 

Notion de flèche.897 

Ensemble de vecteurs.898 

Pseudo vecteurs.899 

Multiplication par un scalaire.900 

Règle de trois.900 

Espaces vectoriels.902 

Combinaisons linéaires.903 

Sous-espaces vectoriels.903 

Familles génératrices.903 

Dépendances et indépendances.904 

Bases d'un espace vectoriel.905 

Angles directeurs.906 

Dimensions d'un espace vectoriel.907 

Prolongements d'une famille libre.908 

Rang d'une famille finie.909 

Sommes directes.909 

Espace affine.910 

Espace vectoriel euclidien.912 

Norme d'un vecteur.912 

Produit scalaire vectoriel.913 

Projection orthogonale.914 

Inégalité de Cauchy-Schwartz.917 

Inégalité triangulaire.918 

Produit scalaire (général).919 

Produit vectoriel.920 

Produit mixte.925 

Espaces vectoriels fonctionnels.926 

Espaces vectoriels hermitiens.927 

Produit hermitien.929 

Types d'espaces vectoriels.930 

Système de coordonnées.930 

Système cartésien.931 

Système sphérique.932 

Système cylindrique.936 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


IX 





























































Vincent ISOZ [v3.0 - 2013] 


[SCIENCES.CH] 


Système polaire.938 

Opérateurs différentiels.940 

Gradient d'un champ scalaire.940 

Gradient d'un champ de vecteurs.944 

Divergences d'un champ de vecteurs.945 

Rotationnels d'un champ de vecteurs.952 

Laplaciens d'un champ scalaire.959 

Laplacien d'un champ vectoriel.964 

_ Identités.965 

Algèbre linéaire . 975 

Systèmes linéaires.976 

Transformations linéaires.979 

Matrices .980 

Matrice associée.982 

Opérations sur les matrices.984 

Types de matrice.986 

Matrice unité.981 

Matrice échelonnée.983 

Matrice inversible.986 

Matrice transposée.986 

Matrice adjointe.987 

Matrice hermitique (self-adjointe).988 

Matrice nilpotent.988 

Matrice orthogonale.988 

Matrice symétrique.989 

Matrice anti-symétrique.989 

Matrice triangulaire.989 

Matrice diagonale.990 

Matrice de passage.990 

Déterminants.991 

Propriétés des déterminants.997 

Dérivée d'un déterminant.1003 

Inverse d'une matrice.1005 

Changements de base.1006 

Matrice de passage.1006 

Valeurs et vecteur propres.1008 

Spectre.1008 

Polynômes caractéristique.1009 

Matrices de rotation.1010 

_ Théorème spectral.1012 

Calcul tensoriel . 1021 

Tenseur .1021 

Notation indicielle.1023 

Sommation sur plusieurs indices.1025 

Symbole de Kronecker.1025 

Symbole d'antisymétrie.1026 

Métrique et signature.1032 

Déterminant de Gram.1035 

Composantes contravariantes et covariantes.1040 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


X 





































































Vincent ISOZ [v3.0 - 2013] 


[SCIENCES.CH] 


Opérations dans les bases.1042 

Méthode d'orthogonalisation de Schmidt.1043 

Changements de bases.1043 

Bases réciproques.1044 

Tenseurs euclidiens.1046 

Tenseurs fondamental.1046 

Produit tensoriel de deux vecteurs.1047 

Espace tensoriel.1049 

Combinaisons linéaires de tenseurs.1053 

Contractions des indices.1054 

Tenseurs particuliers.1057 

Tenseur symétrique.1057 

Tenseur anti-symétrique.1059 

Tenseur fondamental.1062 

Coordonnées curvilignes.1063 

Repère naturel en coordonnées sphériques.1066 

Repère naturel en coordonnées polaires.1067 

Repère naturel en coordonnées cylindriques.1068 

Symboles de Christoffel.1069 

Symboles de 2 eme espèce.1072 

Symboles de l ere espèce.1072 

Théorème fondamental de la géométrie riemanienne.1075 

Théorème de Ricci.1078 

Dérivée de covariante.1079 

Identité de Ricci.1081 

Tenseur de Riemann-Christoffel.1085 

Identités de Bianchi.1088 

Tenseur de Ricci.1089 

Scalaire de Ricci.1089 

Tenseur d'Einstein.1101 

Identité de Bianchi contractée.1102 

Identité d'Einstein.1102 

_ Tenseur d'Einstein.1102 

Calcul spinoriel . 1109 

Spineur unitaire.1110 

Propriétés géométriques.1114 

Symétries planes.1115 

Rotations.1118 

Matrices de Pauli.1121 

Produit spinoriel.1122 

Propriétés des matrices de Pauli.1123 

Théorie des nœuds . 1135 

Représentation des tresses.1135 

Groupe de tresses.1137 

Représentation des noeuds.1140 

Groupe de noeuds.1143 

Nœud de tait.1146 

Formalisation mathématique.1149 

Invariant du noeud.1151 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


XI 





































































Vincent ISOZ [v3.0 - 2013] 


[SCIENCES.CH] 


Support du noeud.1152 

Noeud trivial.1153 

Noeuds isotopes.1154 

Noeuds équivalents.1154 

Isotopie.1155 

Mouvements de Reidemeister.1155 

_ Représentation planaire.1158 

Analyse fonctionnelle . 1165 

Représentations.1165 

Représentation tabulaire.1166 

Représentations graphiques.1166 

Représentations planes.1167 

Représentations spatiales.1169 

Représentations vectorielles.1175 

Propriétés des représentations graphiques.1177 

Représentations analytiques.1183 

Domaine naturel de définition.1184 

Fonctions.1185 

Dépendances.1185 

Domaine d'existence.1185 

Croissance et décroissance.1185 

Périodicité.1185 

Parité.1186 

Composition.1188 

Types de fonctions.1188 

Fonction puissance.1188 

Fonction exponentielle.1188 

Fonction logarithmique.1189 

Fonctions trigonométriques.1189 

Fonctions polynomiales.1189 

Fractions rationnelles.1189 

Fonctions algébriques.1189 

Fonctions en escalier.1189 

Limite et continuité.1190 

Asymptotes.1194 

Logarithmes.1198 

Base népérienne.1200 

Fonction exponentielle naturelle.1203 

Produit scalaire fonctionnel.1205 

Analyse complexe . 1213 

Applications linéaires. Izl J 

Fonction complexe.1213 

Fonctions holomorphes.1221 

Théorème de Cauchy-Riemann.1222 

Conditions de Cauchy.1222 

Orthogonalité des iso-courbes réelles et imaginaires.1227 

Transformation conforme.1228 

Logarithme complexe.1230 

Intégration de fonctions complexes.1231 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


XII 





































































Vincent ISOZ [v3.0 - 2013] 


[SCIENCES.CH] 


Théorème de Cauchy.1233 

Fonctions méromorphes.1235 

Théorème intégral de Cauchy.1235 

Théorème intégral de Cauchy généralisé.1237 

Série de Laurent à puissances positives.1237 

Convergence d'une série.1238 

Décomposition en chemins.1246 

Chemin inverse.1248 

Séries de Laurent.1249 

Singularités.1257 

Singularité apparente.1258 

Singularité essentielle.1258 

Pôle.1259 

Théorème des résidus.1260 

_ Pôle à l'infini.1265 

Topologie . 1270 

Espace topologique.1270 

Espace de Hausdorff.1271 

Espace métrique et distance.1272 

Semi-distance.1272 

Distance ultramétrique.1273 

Distance euclidienne.1274 

Distance hôlderienne.1274 

Distance discrète.1275 

Distances équivalentes.1275 

Fonctions lipchitziennes.1276 

Ensembles ouverts et fermés.1277 

Boules.1278 

Parties.1279 

Boules généralisées.1281 

Diamètre.1282 

Variétés.1283 

_ Variétés différentiables.1284 

Théorie de la mesure . 1290 

Espaces mesurables.1290 

Tribu.1290 

Tribu borélienne.1293 

Théorème de la classe monotone.1296 


|| Géométrie. 

.1303 I 

Trigonométrie . 

U 

. 1304 

J ^ ^ * 


Trigonométrie du cercle.1305 

Relations remarquables.1311 

Formules de Carnot.1313 

Formules de Simpson.1315 

Théorème du cosinus.1316 

Théorème du sinus.1317 

Trigonométrie hyperbolique.1318 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


XIII 






































































Vincent ISOZ [v3.0 - 2013] 


[SCIENCES.CH] 


Relations remarquables.1323 

Trigonométrie sphérique.1324 

Formule des cosinus.1326 

Relations des sinus.1327 

Angle solide.1329 

Géométrie euclidienne . 1337 

Objets de la géométrie euclidienne.1337 

Dimensions.1338 

Constructions d'Euclide.1343 

Droites et segments.1344 

Grandeurs de même espèce.1344 

Plan.1349 

Déplacement et retournement.1349 

Angles.1350 

Angle saillant.1350 

Angles adjacents.1350 

Angles alternes/internes.1353 

Mesure des angles.1353 

Unités de mesure des angles.1353 

Bissectrice.1354 

Triangles.1358 

Triangles égaux.1359 

Triangles isocèles.1361 

Médiatrice.1361 

Lieu géométrique.1362 

Triangles équilatéraux.1363 

Triangles rectangles.1364 

Triangles rectangles isocèles.1365 

Inégalités dans les triangles.1365 

Théorème de Pythagore.1367 

Théorème de Thalès.1369 

Parallélisme.1372 

Cercles.1374 

Axiomatique de Hilbert.1374 

Axiomes d'associations (A).1377 

Axiomes d'ordre (O).1377 

Axiomes de congruence.1378 

Axiomes de continuité.1378 

Axiomes des parallèles.1378 

Barycentre.1379 

Transformations dans le plan.1383 

Translation.1383 

Homothétie.1384 

Rotation.1387 

Réflexion.1391 

Géométries non-euclidiennes . 1397 

Géodésique et équation métrique.1398 

Équation métrique euclidienne.1400 

Coordonnées de Gauss.1401 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


XIV 





































































Vincent ISOZ [v3.0 - 2013] 


[SCIENCES.CH] 


Coordonnées de Riemann.1401 

Espaces de Riemann.1401 

Forme quadratique fondamentale.1403 

Géométrie projective . 1409 

Perspective conique (centrale).1409 

Images de points.1411 

Exemple avec Adobe Flash.1414 

Exemple avec WebGL.1425 

Images de droites.1428 

Perspective affines.1435 

Perspective cavalière.1436 

Projection orthogonale.1436 

Coordonnés homogènes.1438 

Géométrie analytique . 1445 

Coniques.1445 

Approche algébrique.1445 

Approche géométrique.1455 

Foyer.1455 

Paramètre de la parabole.1455 

Paramètre de l'ellipse.1458 

Paramétrisations.1464 

Équation du plan.1464 

Équation d'une droite.1466 

Équation d'un cône.1471 

Équation d'une sphère.1472 

Équation d'un ellipsoïde.1474 

Équation d'un cylindre.1476 

_ Surface de révolution.1477 

Géométrie différentielle . 1486 

Courbes paramétrées.1486 

Parabole osculatrice.1491 

Isoclines .1493 

Trièdre de Frenet.1498 

Vecteur de courbure.1500 

Repère de Frenet.1501 

Rayon de courbure.1501 

l ere formule de Frenet.1501 

Cercle osculateur.1502 

2 ème formule de Frenet.1504 

3 eme formule de Frenet.1504 

Trièdre de Frenet.1504 

Nappes paramétrées.1510 

Métrique d'une surface.1512 

Première forme quadratique fondamentale.1512 

_ Régularité d'une surface.1513 

Formes géométriques . 1522 

Surfaces connues.1523 

Polygones.1523 

Polygone croisé.1523 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


XV 














































































Vincent ISOZ [v3.0 - 2013] 


[SCIENCES.CH] 


Polygone concave. 

Polygone convexe. 

Rectangle. 

Carré . 

Triangle. 

Triangle quelconque. 

Triangle isocèle. 

Triangle équilatéral. 

Triangle rectangle. 

Trapèze. 

Parallélogramme. 

Losange. 

Cercle. 

Ellipse. 

Volumes connus. 

Polyèdres. 

Parallélépipède. 

Pyramide. 

Prisme droit. 

Polyèdres réguliers. 

Tétraèdre. 

Hexaèdre régulier (cube). 

Octaèdre. 

Icosaèdre. 

Dodécaèdre. 

Corps de révolutions. 

Cylindre. 

Cône. 

Sphère. 

Tore. 

Ellipsoïde. 

Paraboloïde. 

Tonneau à section circulaire (vertical). 


.1524 

.1524 

.1527 

.1528 

,1529 

.1529 

.1531 

,1532 

.1533 

.1534 

,1534 

.1535 

,1535 

.1537 

,1539 

,1540 

.1541 

,1543 

.1544 

.1544 

,1548 

.1550 

.1551 

.1555 

.1560 

,1566 

.1567 

.1569 

.1571 

.1574 

,1578 

.1582 

,1582 


Théorie des graphes. 


.1591 


Définitions. 

Formule d'Euler.... 
Ponts de Kônigsberg.. 

Théorème d'Euler. 
Matrice d'adjacence... 


.1591 

,1592 

.1603 

,1604 

.1607 

.1613 


| Mécanique. 

.1621 | 

Principes . 

. 1622 


MKSC. 

Analyse dimensionnelle. 
Notations scientifiques... 

Temps. 

Longueur. 


.1625 

.1627 

.1629 

.1631 

,1632 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


XVI 































































Vincent ISOZ [v3.0 - 2013] 


[SCIENCES.CH] 


Masse.1633 

Énergie.1635 

Charge.1636 

Distributions.1638 

Constantes.1639 

Constantes universelles.1640 

Constantes physiques diverses.1641 

Constantes physico-chimiques diverses.1642 

Constantes astrophysiques diverses.1642 

Constantes de Planck.1643 

Unités naturelles.1644 

Cube de Okun.1645 

Principes de la physique.1646 

Principe de causalité.1646 

Trilemne de Fries.1646 

Principe de conservation de l'énergie.1646 

Principe de moindre action.1648 

Principe de Noether.1649 

Invariance par translation dans l'espace.1651 

Invariance par rotation dans l'espace.1652 

Invariance par translation dans le temps.1653 

Théorème de Noether.1654 

Principe premier de Curie.1658 

_ E spaces ponctuels . 1 65 9 

Mécanique analytique . 1670 

Formalisme Lagrangien.1671 

Coordonnées généralisées et référentiels.1672 

Référentiel galiléen.1672 

Repère de Copernic/Kepler.1673 

Référentiel géocentrique.1673 

Repère orthonormé direct.1673 

Coordonnées généralisées.1674 

Principe variationnel.1675 

Intégrale d'action.1676 

Équation d'Euler-Lagrange.1676 

Action.1677 

Équations d'Euler-Lagrange.1679 

Identité de Beltrami.1681 

Théorème du calcul variationnel.1683 

Formalisme canonique.1685 

Transformation de Legendre.1686 

Hamiltonien.1686 

Moments canoniques.1686 

Fonction de Hamilton.1687 

Équations canoniques du mouvement.1690 

Crochets de Poisson.1692 

Identité de Jacobi.1694 

Transformations canoniques.1695 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


XVII 























































Vincent ISOZ [v3.0 - 2013] 


[SCIENCES.CH] 


Mécanique classique rationnelle . 1701 

Lois de Newton.1705 

Première loi (loi d'inertie).1705 

Deuxième loi (principe fondamental de la dynamique).1707 

Troisième loi (action et réaction).1709 

Conditions d'équilibre.1709 

Centre de masse et masse réduite.1709 

Théorème du centre de masse.1711 

Théorème de Guldin.1713 

Cinématique.1714 

Position.1714 

Vitesse.1715 

Accélération.1716 

Vitesse de libération.1718 

Plan osculateur.1719 

Accélération tangentielle.1720 

Accélération normale.1720 

Force centrifuge.1721 

Principe de relativité galiléen.1721 

Transformation de Galilée.1721 

Moment cinétique.1724 

Théorème du moment cinétique.1726 

Moment de force.1728 

Bras de levier.1728 

Statique des forces.1731 

Balistique.1734 

Cinématique de rotation.1736 

Vitesse angulaire.1736 

Accélération angulaire.1738 

Figures de Lissajous.1741 

Travail et énergie.1742 

Énergie cinétique.1743 

Moment d'inertie.1743 

Rayon de giration.1746 

Moment d'inertie polaire.1747 

Théorème d'Huygens-Steiner.1749 

Tenseur d'inertie.1749 

Ellipsoïde d'inertie.1755 

Gyroscope.1756 

Gyroscope symétrique pesant.1757 

Précession.1760 

Énergie potentielle gravifique.1762 

Énergie potentielle d'une sphère de matière.1766 

Conservation de l'énergie mécanique totale.1767 

Conservation de la quantité de mouvement.1768 

Loi de Newton généralisée.1769 

Action lagrangienne.1771 

Lagrangien mécanique.1771 

Puissance.1773 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


XVIII 





























































Vincent ISOZ [v3.0 - 2013] 


[SCIENCES.CH] 


Puissance d'une machine tournante.1774 

Rendement.1774 

Mouvements relatifs et forces d'inerties.1775 

Accélération de Coriolis.1779 

Principe d'Alembert.1779 

Théorème de Konig.1782 

Premier théorème de Konig.1782 

Deuxième théorème de Konig.1783 

Mouvements oscillants.1784 

Pendule de Newton.1785 

Pendule simple.1787 

Pendule physique.1789 

Pendule élastique.1792 

Pendule conique.1795 

Pendule de torsion.1797 

Pendule de Foucault.1797 

Pendule de Huygens.1800 

Isochronisme rigoureux.1800 

Courbe brachistochrone.1801 

Pendule double.1808 

Tribologie.1812 

Frottement statique.1812 

Frottement dynamique.1814 

Lois de Coulomb.1815 

Frottement exponentiel.1815 

Frottement visqueux horizontal.1818 

Frottement visqueux vertical.1820 

Frottement visqueux de Stokes vertical.1821 

_ Frottement visqueux de Stokes horizontal.1823 

Mécanique ondulatoire . 1832 

Fonction d'onde.1832 

Vitesse de phase.1832 

Amplitude.1832 

Équation d'onde/d'Alembert.1833 

Types d'ondes.1835 

Ondes périodiques.1835 

Longueur d'onde.1835 

Ondes harmoniques.1836 

Nombre d'onde.1836 

Ondes stationnaires.1837 

Modes de vibrations dans un fil tendu.1839 

Équation des cordes vibrantes.1840 

Conditions de Dirichlet.1841 

Conditions de Cauchy.1841 

Conditions de Neumann.1847 

Lagrangien d'une corde.1849 

Densité lagrangienne.1850 

Modes de vibrations dans une membrane tendue.1853 

Phaseurs .1859 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


XIX 





























































Vincent ISOZ [v3.0 - 2013] 


[SCIENCES.CH] 


Vecteur d'onde.1860 

Relation de dispersion.1861 

_ Paquet d'onde.1864 

Mécanique statistique . 1869 

Théorie statistique de l'information.1869 

Quantité d'information intrinsèque.1870 

Formule de Shannon.1872 

Information mutuelle moyenne.1872 

Loi de Boltzmann.1874 

Distributions statistiques physiques.1878 

Distribution de Maxwell.1878 

Distribution de Maxwell-Boltzmann.1885 

Fonction de Maxwell-Boltzmann.1890 

Statistique de Maxwell-Boltzmann.1891 

Fonction de partition canonique.1891 

Distribution de Boltzmann.1892 

Distribution de Fermi-Dirac.1894 

Énergie et température de Fermi.1898 

Distribution de Bose-Einstein.1898 

Condensation de Bose-Einstein.1899 

Loi de Fick.1903 

Deuxième loi de Fick.1904 

Première loi de Fick.1904 

Mouvement brownien.1908 

Équation de Langevin.1908 

_ Relation de Sutherland-Einstein.1912 

Thermodynamique . 1918 

Variables thermodynamiques.1919 

Systèmes thermodynamiques.1921 

Types de systèmes.1922 

Transformation thermodynamique.1922 

Types de transformations.1922 

Types de cycles.1923 

Variables d'état.1923 

Variables extensives/intensives.1924 

Phases.1925 

Équations d'état.1926 

Équation d'état d'un gaz parfait.1926 

Équation d'état d'un liquide.1927 

Équation d'état d'un solide.1930 

Principes de la thermodynamique.1932 

Principe zéro (équilibre thermique).1932 

Principe premier (principe d'équivalence).1932 

Principe deuxième (irréversibilité).1933 

Principe troisième (principe de Nernst).1933 

Capacités calorifiques.1934 

Modèle d'Einstein (Dulong-Petit) de la capacité calorifique des solides cristallins.1936 

Modèle de Debye de la capacité calorifique des solides cristallins.1937 

Énergie interne.1942 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


XX 





































































Vincent ISOZ [v3.0 - 2013] 


[SCIENCES.CH] 


Travail des forces mécaniques.1945 

Enthalpie.1947 

Loi de Laplace.1949 

Relation de Mayer.1949 

Coefficients thermoélastiques.1953 

Chaleur.1956 

Entropie.1957 

Écoulement de la chaleur.1962 

Cycle de Carnot.1964 

Relations de Maxwell.1966 

Énergie libre.1968 

Enthalpie libre.1968 

Équations de Gibbs.1968 

Transformations de Legendre.1970 

Équation de continuité.1971 

Équation de la chaleur.1975 

Loi de Fourier.1976 

Noyau de la chaleur.1983 

Rayonnement thermique.1985 

Loi de Stefan-Boltzmann.1987 

Loi de Planck.1993 

Loi de Rayleigh-Jeans.1998 

Première loi de Wien.1999 

Constante de Stefan-Boltzmann.2003 

Deuxième loi de Wien.2004 

_ Constante de Wien.2004 

Mécanique des milieux continus . 2011 

- Solides . 2011 

Pressions.2012 

Élasticité des solides.2013 

Module de Young.2014 

Loi de Hooke.2015 

Module de cisaillement.2016 

Module de glissement.2018 

Coefficient de Poisson.2019 

Module de compressibilité.2026 

Coefficient de compressibilité.2027 

Module de flexion.2027 

Liquides .2033 

Théorème de Pascal.2034 

Viscosité.2035 

Loi de Poiseuille.2037 

Théorème de Bernoulli.2038 

Équation de Laplace.2043 

Théorème de Toricelli.2043 

Effet Venturi.2044 

Tube de Pitot.2045 

Perte de charge (pression).2045 

Équations de Navier-Stokes.2047 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


XXI 





























































Vincent ISOZ [v3.0 - 2013] 


[SCIENCES.CH] 


Fluides incompressibles.2064 

Équation d'Euler de 1ère forme.2065 

Équation d'Euler de 2ème forme.2066 

Fluide compressible (barotropes).2070 

Fluide statique.2070 

Équation de la statique des fluides (loi fondamentale de l'hydrostatique).2070 

Nombre de Reynolds.2070 

Approximation de Boussinesq.2073 

Loi de Stokes.2075 

Pression hydrostatique.2078 

Poussée d'Archimède.2079 

Vitesse du son dans un liquide.2080 

Gaz.2081 

Type de gaz.2081 

Gaz parfait.2081 

Loi de Boyle-Mariott.2081 

Loi de Gay-Lussac.2082 

Loi de Chasles.2082 

Gaz réel.2083 

Théorème du Viriel.2083 

Équation de Van der Waals.2083 

Pression cinétique.2092 

Température cinétique.2094 

Libre parcours moyen.2096 

Plasmas .2098 

Degré d'ionisation.2099 

Lréquence plasma.2099 

Équation hydrodynamique des électrons.2103 


Electrodynamique.2108 


Électrostatique . 2109 

Force électrique.2109 

Loi de Coulomb.2109 

Permittivité du vide.2110 

Constante diélectrique.2110 

Champ électrique.2110 

Champ de déplacement.2111 

Potentiel électrique.2111 

Différence de potentiel.2111 

Indépendance du chemin.2113 

Équipotentielles et lignes de champ.2114 

Fil rectiligne infini.2116 

Dipôle électrique rigide.2219 

Moment dipolaire.2121 

Llux du champ électrique.2129 

Llux électrique.2129 

Loi de Gauss (du champ électrique).2129 

Capacités.2130 

Condensateur plan.2130 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


XXII 
























































Vincent ISOZ [v3.0 - 2013] 


[SCIENCES.CH] 


Condensateur cylindrique.2131 

Condensateur sphérique.2131 

Rigidité diélectrique.2133 

_ Energie potentielle électrostatique.2134 

Magnétostatique . 2140 

Théorème d’Ampère.2142 

Excitation magnétique.2142 

Susceptibilité magnétique.2142 

Perméabilité magnétique absolue.2143 

Bobine solénoïdale infinie.2144 

Bobine toroïdale.2145 

Électro-aimant.2146 

Force d'un aimant ou électro-aimant.2147 

Relation de Maxwell-Ampère.2149 

Loi de Biot-Savart.2150 

Champ magnétique pour une boucle de courant.2152 

Champ magnétique pour un fil infini.2153 

Dipôle magnétique.2155 

Moment magnétique dipolaire.2160 

Facteur gyromagnétique.2162 

Loi de Lorentz.2162 

Loi de Laplace.2167 

Effet Hall classique.2167 

Coefficient de Hall.2168 

Résistance de Hall.2169 

Rayon de Larmor.2170 

Pulsation gyro-synchrotron.2171 

Énergie d'un dipôle magnétique.2173 

Modèle de Langevin du diamagnétisme.2176 

Relation de la susceptibilité diamagnétique de Langevin.2179 

Modèle de Langevin du paramgnétisme.2179 

Fonction de Langevin.2182 

_ Relation de la susceptibilité paramagnétique de Langevin.2184 

Électrodynamique . 2189 

Première équation de Maxwell.2190 

Loi de Gauss (du champ électrique).2192 

Équation de Maxwell-Poisson.2193 

Deuxième équation de Maxwell.2193 

Loi de Gauss (du champ magnétique).2195 

Troisième équation de Maxwell.2195 

Loi de Lenz-Faraday.2195 

Loi de Maxwell-Faraday.2197 

Bêtatron.2197 

Quatrième équation de Maxwell.2200 

Courant de déplacement.2202 

Équation de Maxwell-Ampère.2203 

Formes locales des équations de Maxwell.2203 

Monopoles magnétiques.2204 

Équations de Dirac-Maxwell symétrisées.2206 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


XXIII 





































































Vincent ISOZ [v3.0 - 2013] 


[SCIENCES.CH] 


Équation de conservation de la charge.2207 

Théorie de Jauges (électromagnétiques).2208 

Potentiel vecteur.2208 

Potentiel scalaire.2209 

Jauge de Lorenz.2209 

Jauge de Coulomb.2210 

Équation de Poisson du potentiel vecteur.2210 

Jauge arbitraire.2211 

Équation d'onde des potentiels électromagnétiques.2211 

Quadrivecteur potentiel.2212 

Quadrivecteur courant.2212 

Tenseur du champ électromagnétique.2214 

Lagrangien de l'interaction cours-champs.2217 

Tenseur de Faraday.2220 

Équations du mouvement d'une particule dans un champ électromagnétique.2220 

Équations de Maxwell sous forme tensorielle.2226 

Lagrangien total de l'interaction charge-champ.2231 

Équation d'onde électromagnétique.2231 

Équation de propagation.2232 

Vitesse de propagation.2233 

Équation de Helmholtz.2236 

Énergie véhiculée.2237 

Intensité d'une onde électromagnétique.2238 

Émission.2239 

Rayonnement synchrotron.2241 

_ Potentiels de Liénard-Wiechert.2245 

Électrocinétique . 2258 

- Lois de Kirchhoff . 2258 

Loi des mailles.2259 

Loi des nœuds.2259 

Modèle de Drude.2259 

Libre parcours moyen de l'électron de conduction.2260 

Temps de collision moyen de l'électron de conduction.2260 

Vitesse moyenne de dérive.2261 

Résistivité en fonction de la température.2264 

Loi d'Ohm.2265 

Résistance électrique.2265 

Résistances équivalentes.2267 

Série.2267 

Parallèle.2267 

Capacités équivalentes.2268 

Série.2268 

Parallèle.2268 

Force électromotrice.2269 

Puissance électrique.2269 

Champ électromoteur.2270 

Force électromotrice (FEM).2272 

Loi de Faraday.2272 

Loi de Lenz.2274 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


XXIV 





























































Vincent ISOZ [v3.0 - 2013] 


[SCIENCES.CH] 


Inductance.2275 

Coefficient d'auto-induction.2275 

Effet de peau.2278 

Semi-conducteurs.2281 

Modèle semi-classique des bandes paraboliques.2282 

Particule quasi-libre.2286 

Densité de modes.2289 

Sphère de Fermi .2289 

Densité statistique non dégénérée des porteurs négatifs.2290 

Énergie minimale de la bande de conduction.2292 

Densité statistique non dégénérée des porteurs positifs.2296 

Énergie maximale de la bande de valence.2297 

Bandes d'énergie.2300 

Bande interdite.2300 

Bande de conduction.2301 

Bande de valence.2301 

Loi d'Ohm (des semi-conducteurs).2303 

_ Vitesse de Fermi.2304 

Optique géométrique . 2310 

Sources et ombres.2310 

Couleur .2313 

Synthèse additive.2315 

Synthèse soustractive.2316 

Photométrie.2317 

Flux énergétique.2318 

Loi de Beer-Lambert.2318 

Intensité lumineuse.2319 

Émittance énergétique.2320 

Luminance énergétique.2321 

Loi de Lambert.2322 

Loi de Kirchhoff.2323 

Décomposition spectrale.2323 

Loi de réfraction.2324 

Principe de Fermât.2324 

Loi de Snell-Descartes.2328 

Loi de réfraction.2329 

Effet Tcherenkov.2331 

Formules de Descartes.2332 

Formule de Descartes pour la réflexion sur une surface sphérique.2334 

Formule de Descartes pour la réfraction au passage d'une surface sphérique.2339 

Première formule de Descartes pour les lentilles minces.2342 

Équation de l'opticien.2346 

Deuxième formule de Descartes pour les lentilles minces (formule de conjugaison).2346 

Prisme.2349 

Arc-en-ciel.2352 

_ Angle de l'arc-en-ciel.2356 

Optique ondulatoire . 2362 

Principe d'Huygens.2362 

Loi de Malus.2363 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


XXV 





































































Vincent ISOZ [v3.0 - 2013] 


[SCIENCES.CH] 


Diffraction de Fraunhofer.2364 

Cas d'une fente rectangulaire.2365 

Pouvoir de résolution.2372 

Cas d'un réseau de fentes rectangulaires.2373 

Fentes de Young.2379 

Polarisation de la lumière.2384 

Polarisation linéaire.2388 

Polarisation elliptique.2389 

Polarisation circulaire.2391 

Polarisation naturelle.2391 

Loi de Malus de la polarisation.2393 

Cohérence et interférence.2395 


Physique quantique corpusculaire . 2406 

- Modèle de Dalton .2408 

Modèle de Thomson.2408 

Modèle de Rutherford.2409 

Modèle de Bohr.2410 

Postulats de Bohr.2411 

Quantification.2411 

Intégrale d'action.2412 

Modèles des atomes hydrogénoïdes sans entraînement.2413 

Rayon de Bohr.2414 

Formule de Balmer.2416 

Constante de Rydberg.2416 

Modèle des atomes hydrogénoïdes avec entraînement.2418 

Hypothèse du neutron.2421 

Modèle de Sommerfeld et Wilson.2422 

Nombre quantique azimutal.2424 

Nombre quantique radial.2425 

Modèle relativiste de Sommerfeld.2426 

Constante de structure fine.2434 

Moment magnétique dipolaire quantique.2445 

Facteur gyromagnétique.2445 

Magnéton de Bohr.2445 

Nombre quantique magnétique.2446 

Nombre quantique de moment cinétique orbital.2446 

Spin.2447 

Principe d'exclusion de Pauli.2449 

Couches électroniques.2449 

Nombre quantique principal.2450 

Nombre quantique secondaire/azimutal.2450 

Nombre quantique magnétique.2450 

_ Nombre quantique de spin.2450 

Physique quantique ondulatoire . 2459 

- Postulats . 2460 

1er postulat (état quantique).2461 

Fonction d'onde.2461 


| Atomistique.2405 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


XXVI 

































































Vincent ISOZ [v3.0 - 2013] 


[SCIENCES.CH] 


Condition de normalisation de De Broglie.2461 

2ème postulat (évolution temporelle d'un état quantique).2463 

Opérateur propre.2463 

Fonction propre.2463 

3ème postulat (observables et opérateurs).2464 

Opérateur hermitique.2464 

Principe de correspondance.2465 

4ème postulat (mesure d'une propriété).2466 

5ème postulat (moyenne d'une propriété).2468 

Principes d'incertitudes classiques.2469 

Première relation d'incertitude classique (impulsion).2470 

Deuxième relation d'incertitude classique (spatiale).2470 

Troisième relation d'incertitude classique (temporelle).2472 

Algèbre quantique.2473 

Opérateurs linéaires fonctionnels.2473 

Opérateurs de quantité de mouvement.2476 

Opérateurs adjoints et hermitiques.2476 

Commutateurs et anti-commutateurs.2478 

Relation d'anti-commutation.2480 

Relations d'incertitudes de Heisenberg.2481 

Représentatives.2482 

Valeurs et fonctions propres.2484 

Orthogonalité des fonctions propres.2485 

Formalisme de Dirac.2488 

Kets et Bras.2488 

Comparaison formalisme.2491 

Modèle de Schrodinger.2491 

Onde associée de De Broglie.2491 

Longueur d'onde associée.2492 

Onde thermique associée de De Broglie.2493 

Équation classique de Schrodinger.2493 

Équation unidimensionnelle de Schrodinger.2495 

Hamiltonien de Schrodinger.2496 

Condition de normalisation de De Broglie.2499 

États liés et non liés.2502 

Équation d'évolution classique de Schrodinger.2503 

Opérateur d'évolution.2503 

Condition d'hermicité.2507 

Opérateur de Heisenberg.2508 

Séparation des variables.2509 

Combinaison linéaire des états.2511 

État stationnaire.2511 

Équation de continuité.2513 

Implications et applications.2514 

Particule libre.2515 

Courbe de dispersion.2516 

Paquet d'ondes unidimensionnelles.2516 

Paquet d'ondes quasi-monochromatiques.2520 

Puits de potentiel à parois rectilignes.2522 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


XXVII 























































Vincent ISOZ [v3.0 - 2013] 


[SCIENCES.CH] 


Énergie de Fermi.2531 

Oscillateur harmonique.2532 

Relation de De Broglie.2533 

Opérateurs de création/destruction.2537 

Effet tunnel.2545 

Coefficient de transmission/réflexion.2549 

Principe de superposition linéaire des états.2557 

Théorème d'Ehrenfest.2568 

Moment cinétique et spin.2572 

Opérateur moment cinétique orbital.2573 

Spin.2576 

Moment cinétique total.2577 

Opérateur de Casimir.2577 

Couplage spin-orbite.2590 

Dimensions de Planck.2594 

_ Interprétation de Copenhague.2597 

Physique quantique relativiste . 2605 

Equation d'évolution relativiste de Schrodinger.2605 

Équation de Klein-Gordon libre.2606 

Antimatière.2607 

Équation de Klein-Gordon généralisée.2610 

Équation de Dirac libre classique.2616 

Équations de Weyl.2622 

Bispineur.2623 

Équation de Dirac.2624 

Matrices de Dirac (matrices gamma).2624 

Solutions particulières de l'équation de Dirac.2629 

Hélicité.2631 

Équation de Dirac libre linéarisée.2631 

Équation de Dirac généralisée.2643 

Équation de Pauli.2644 

Terme de Stern-Gerlach.2649 

Facteur de Landé.2651 

Moment magnétique orbital et de spin.2651 

Énergie de Zeeman.2652 

_ Fréquence de résonance.2653 

Physique nucléaire . 2659 

L'arme nucléaire.2659 

Radioactivité.2661 

Nombre atomique.2661 

Nombre de masse.2662 

Isotones.2662 

Désintégration.2663 

Constante radioactive.2664 

Demi-vie d'isotope.2665 

Activité radioactive.2665 

Équation d'activité.2665 

Datation au carbone 14.2667 

Filiation radioactive.2668 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


XXVIII 































































Vincent ISOZ [v3.0 - 2013] 


[SCIENCES.CH] 


Équilibre séculaire.2671 

Équilibre transitoire.2671 

Non-équilibre.2672 

Phénomènes radioactifs.2673 

Énergie de liaison.2674 

Courbe d'Aston.2674 

Vallée de stabilité.2676 

Fusion nucléaire (1).2677 

Fission nucléaire (2).2677 

Désintégration alpha (3).2679 

Désintégration bêta - (4).2688 

Désintégration bêta + (5).2690 

Capture électronique (6).2691 

Émission gamma (7).2692 

Conversion interne (8).2692 

Électron de conversion.2692 

Électron Auger.2693 

Radioprotection.2695 

Formule de Bethe-Bloch.2696 

Effet Compton.2699 

Longueur d'onde de Compton.2702 

Effet photoélectrique.2702 

Diffusion de Rutherford.2706 

Paramètre d'impact.2707 

Section efficace.2709 

Section différentielle efficace de Rutherford.2711 

Rayons-X et Gamma.2714 

Coefficient d'atténuation massique.2715 

Section efficace microscopique.2716 

Longueur de relaxation.2717 

Création paires électron-positron.2717 

Modèle nucléaire "goutte liquide".2718 

Énergie de liaison en volume.2719 

Énergie de liaison superficielle.2720 

Énergie de répulsion électrostatique.2721 

Énergie d'asymétrie (énergie de Pauli).2722 

Énergie de paie (énergie d'appariement).2727 

_ Formule semi-empirique de von Weizsâcker.2727 

Physique quantique des champs . 2739 

Photons virtuels.2 /41 

Potentiel de Yukawa.2742 

Champs massiques.2743 

Énergie mise enjeu dans l'interaction nucléaire forte.2744 

Énergie mise enjeu dans l'interaction nucléaire faible.2745 

Champs non-massiques.2745 

Équation d'Euler-Lagrange des champs.2746 

Équations du mouvement de Heisenberg.2747 

Principe de correspondance.2751 

Équation de Lagrange des champs.2752 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


XXIX 





























































Vincent ISOZ [v3.0 - 2013] 


[SCIENCES.CH] 


Lagrangien de Klein-Gordon. 

Lagrangien d'interaction du champ électromagnétique avec une densité . 

Lagrangien total du champ électromagnétique. 

Lagrangien du champ spinoriel de Dirac libre. 

Théories de jauge. 

Invariance de jauge globale. 

Invariance de jauge locale. 


.2752 

.2754 

.2755 

.2756 

.2757 

.2758 

.2759 

.2764 



Physique des particules . 

. 2770 


Constantes de couplage. 

.2771 


Résonance magnétique de spin.. 

.2773 


Résonance magnétique électronique. 

.2780 


Résonance magnétique nucléaire. 

.2781 

| Cosmologie. 

.2785 | 

Astronomie . 

. 2786 


Equation de Drake. 

Lois de Kepler. 

Première loi de Kepler. 

Deuxième loi de Kepler. 

Troisième loi de Kepler. 

Loi de la gravitation de Newton. 

Potentiel gravitationnel. 

Équation de Newton-Poisson. 

Sphérisation des corps célestes. 

Aplatissement des corps célestes. 

Stabilité des atmosphères. 

Limite de Roche. 

Trajectoires d'orbitales képleriennes. 

Première formule de Brinet. 

Deuxième formule de Brinet. 

Période orbitale képlérienne. 

Déflexion classique de la lumière. 

Précession du périhélie. 

Durée de l'arc Diurne. 

Mouvement des planètes. 

Période synodique et sidérale. 

Rétrogradation des planètes. 

Points de Lagrange. 

Positions d'équilibre du premier type.... 

Point L1 de Lagrange. 

Point L2 de Lagrange. 

Point L3 de Lagrange. 

Positions d'équilibre du deuxième type. 
Points L4, L5 de Lagrange. 


.2788 

.2788 

.2788 

.2789 

.2790 

.2793 

.2794 

.2795 

.2796 

.2798 

.2799 

.2800 

.2801 

.2806 

.2809 

.2809 

.2812 

.2821 

.2827 

.2828 

.2830 

.2835 

.2841 

.2842 

.2847 

.2849 

.2852 

.2852 


Astrophysique . 2863 


Étoiles . 

Genèse. 

Effondrement d'un nuage interstellaire. 


.2868 

.2868 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


XXX 








































































Vincent ISOZ [v3.0 - 2013] 


[SCIENCES.CH] 


Masse de Jeans.2869 

Rayon de Jeans.2870 

Temps de chute libre.2871 

Durée de vie nucléaire.2871 

Température interne.2873 

Température externe.2874 

Luminosité.2875 

Éclat.2875 

Magnitude apparente.2876 

Loi de Pogson.2877 

Magnitude absolue.2877 

Étoiles variables.2879 

Parallaxe trigonométrique.2881 

Effet Doppler-Fizeau relativiste.2882 

Décalage spectral.2883 

Vitesse apparente.2885 

Limite de Chandrasekhar.2888 

_ Limite de rupture de rotation.2892 

Relativité restreinte . 2898 

Principes et postulats.2898 

Postulat d'invariance.2899 

Principe cosmologique.2899 

Principe de relativité restreinte.2900 

Transformations de Lorentz.2902 

Invariants relativistes.2903 

Facteur de Michelson-Morley.2906 

Quadrivecteur déplacement.2906 

Matrice de Lorentz.2906 

Invariance de l'équation d'onde.2908 

Interprétation hypergéométrique.2910 

Quadri vecteur vitesse.2911 

Quadri vecteur courant.2915 

Quadri vecteur accélération.2916 

Addition relativiste des vitesses.2922 

Variation relativiste des longueurs.2923 

Variation relativiste du temps.2924 

Expérience de Hafele-Keating.2925 

Paradoxe des jumeaux.2929 

Variation relativiste de la masse.2931 

Équivalence masse-énergie.2934 

Énergie au repos.2935 

Lagrangien relativiste.2936 

Action invariante de Lorentz.2937 

Quantité de mouvement relativiste.2938 

Quadri vecteur d'énergie-impulsion.2941 

Relation d'Einstein.2942 

Force relativiste.2943 

Quadri vecteur force.2944 

Électrodynamique relativiste.2944 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


XXXI 





























































Vincent ISOZ [v3.0 - 2013] 


[SCIENCES.CH] 


Transformation du tenseur de champ.2951 

Espace-Temps de Minkowski.2952 

Quadri vecteurs.2955 

_ Cône d'Univers.2956 

Relativité générale . 2966 

Postulats et principes.2966 

Postulat d'équivalence.2966 

Principe de Mach.2969 

Métriques.2970 

Équation métrique.2970 

Tenseur métrique.2973 

Signature.2975 

Critère de Schild.2975 

Effet Einstein.2976 

Équations du mouvement.2978 

Lagrangien géodésique.2985 

Équation des géodésiques.2987 

Connexion affine.2991 

Limite newtonienne.2992 

Tenseur d'énergie-impulsion.2994 

Matrice des flux de moments.2998 

Équation d'Einstein des champs.3000 

Solution de Schwarzschild.3005 

Coordonnées de Schwarzschild.3006 

Métrique de Schwarzschild.3013 

Vérifications expérimentales.3016 

Précession du périhélie de Mercure.3016 

Formule de Binet non relativiste.3022 

Déflexion de la lumière.3029 

Effet Shapiro.3034 

_ Trous Noirs.3041 

Cosmologie . 3047 

Modèle cosmologique newtonien.3047 

Principe cosmologique.3047 

Loi de Hubble.3048 

Constante et temps de Hubble.3051 

Équations de Friedmann.3051 

Première équation de Friedman.3052 

Deuxième équation de Friedman.3055 

Densité critique.3056 

Paramétrique de densité cosmologique.3057 

Modèles cosmologique de Friedmann-Lemaître.3060 

Espace plat (K=0).3060 

Espace plat dominé par la matière.3062 

Espace plat dominé par la radiation.3063 

Espace sphérique (X>0).3066 

Espace sphérique dominé par la matière.3070 

Espace sphérique dominé par la radiation.3073 

Espace hyperbolique (K< 0).3076 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


XXXII 





































































Vincent ISOZ [v3.0 - 2013] 


[SCIENCES.CH] 


Espace hyperbolique dominé par la matière.3079 

Espace hyperbolique dominé par la radiation.3082 

Univers observable.3085 

Rayonnement fossile.3097 

L'Univers Trou Noir.3100 

Théorie des cordes . 3105 

Equation d'onde non relativiste d'une corde transversale.3106 

Équation d'onde relativiste d'une corde transversale.3108 

Surface d'Univers.3108 

Coordonnée de corde.3113 

Action de Nambu-Goto.3113 

Lagrangien d'une corde.3121 

Chimie quantique . 3130 


Puits de potentiel rectangulaire tridimensionnel infini.3130 

Vibrations moléculaires.3134 

Atome hydrogénoïde.3137 

Approximation de Born-Oppenheimer.3139 

Rotateur rigide.3141 

Polynômes associés de Legendre.3148 

Harmoniques sphériques.3160 

Cartes de densité et d'isodensité.3161 

Profil de potentiel.3170 

_ P ote n ti el élec tr ique écran té _ 3170 

Chimie moléculaire . 3177 

Approximation orbitalaire.3178 

Approximation de Born-Oppenheimer.3179 

Méthode de Slater.3181 

Méthode C.L.O.A.3182 

Fonction liante.3183 

Fonction antiliante.3183 

Liaison covalente.3184 

Intégrales de résonance.3186 

Intégrales coulombiennes.3186 

Intégrales de recouvrement.3187 

_ Équations séculaires.3187 

Chimie analytique . 3195 

Mélanges simples.3196 

Réactions.3197 

Grandeurs stoechiométriques.3197 

Avancement élémentaire de réaction.3198 

Réactif limitant.3199 

_ T aux d'avancement.3199 

Chimie thermique . 3206 

Transformations chimiques.3206 

Chaleur de réaction à volume constant.3207 

Chaleur de réaction à pression constante.3207 

Grandeurs molaires.3208 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


XXXIII 
















































































Vincent ISOZ [v3.0 - 2013] 


[SCIENCES.CH] 


Masse molaire atomique.3208 

Masse molaire moléculaire.3208 

Titre molaire.3209 

Titre massique associé.3210 

Molarité.3210 

Grandeur molaire standard.3210 

Opérateur de Lewis.3213 

Enthalpie standard de réaction.3214 

Loi de Hess.3215 

Relation enthalpique de Kirchhoff.3217 


| Informatique Théorique. 

.3224 I 

Méthodes numériques . 

. 3226 

Complexité. 

. 3228 - 


NP-Complétude.3231 

Partie Entière.3234 

Algorithme d'Héron.3236 

Algorithme dArchimède.3237 

Calcul du nombre d'Euler.3239 

Calcul de la factorielle (formule de Stirling).3239 

Systèmes d'équations linéaires.3240 

Une équation à une inconnue.3240 

Deux équations à deux inconnues.3241 

Trois équations à trois inconnues.3242 

N équations à n inconnues.3243 

Polynômes.3243 

Régressions et interpolations.3246 

Régression linéaire à une variable explicative.3247 

Droite de régression.3248 

Méthode des moindres carrés.3249 

Moindres carrés pour cas non linéaires.3251 

Analyse de la variance de la régression bivariée.3252 

Modèle linéaire gaussien.3256 

Hypothèse de Gauss-Markov.3258 

Intervalle de confiance de la pente.3263 

Intervalle de confiance du coefficient de corrélation.3264 

Test du coefficient de corrélation de Pearson.3264 

Intervalle de confiance des valeurs prédictives.3267 

Intervalle de prédiction.3271 

Régression linéaire à une variable explicative forcée par l'origine.3272 

Régression linéaire multiple.3273 

Régression linéaire de polynômes simples.3278 

Régression polynomiale.3279 

Régression logistique (logit).3280 

Coefficient de corrélation (détermination) généralisé.3288 

Interpolation polynomiale.3289 

Courbes de Bézier (B-spline).3289 

Méthode d'Euler.3296 

Polynôme de collocation.3297 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


XXXIV 

























































Vincent ISOZ [v3.0 - 2013] 


[SCIENCES.CH] 


Méthode (d'interpolation) de Lagrange.3300 

Recherche des racines.3302 

Méthodes des parties proportionnelles.3303 

Méthode de la bissection.3304 

Méthode de la sécante (régula falsi).3305 

Méthode de Newton.3306 

Dérivations numériques.3311 

Intégrations numériques.3312 

Méthode des rectangles.3313 

Méthode des trapèzes.3314 

Aires et sommes de Riemann.3314 

Programmation (optimisation) linéaire.3315 

Système canonique.3320 

Forme standard.3320 

Algorithme du simplexe.3326 

Programmation (optimisation) non linéaire.3331 

Méthode de Newton-Raphson.3333 

Méthode de Gauss-Newton (Newton-Tangente).3339 

Méthodes de Monte-Carlo.3347 

Génération de variables aléatoires.3348 

Nombres pseudo-aléatoires.3348 

Calcul d'une intégrale.3351 

Calcul de Pi.3352 

Modélisation.3353 

Boostrapping.3356 

Dichotomie.3361 

Analyse en composantes principales (A.C.P.).3362 

Plan factoriel.3369 

Analyse factorielle des correspondances (A.F.C.).3379 

Représentation en fréquences conjointes.3380 

Index/Élasticité.3381 

Test d'indépendance du khi-2.3384 

V de Cramer.3387 

phi de Cramer.3389 

Test exact de Fisher.3391 

Kappa d'agrément de Cohen.3396 

Test de McNemar.3398 

Coefficient de Yule.3400 

Test de Cochran-Mantel-Haenzel.3401 

Méthode des différences finies.3408 

M.D.F. à une dimension spatiale.3408 

M.D.F. spatio-temporelle.3408 

Cellule de Yee.3413 

Clustering.3414 

Arbre de régression et de classification (CART).3414 

Indice d'impureté de Gini.3417 

K-Means (nuées dynamiques).3423 

Dendrogramme.3431 

Réseaux de neurones formels.3433 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


XXXV 























































Vincent ISOZ [v3.0 - 2013] 


[SCIENCES.CH] 


Modèle de neurone.3434 

Fonction de transfert.3437 

Architecture de réseau.3439 

Algorithmes génétiques.3448 

Codage et population initiale.3452 

Opérateurs.3454 

Opérateur de sélection.3454 

Opérateur de croisement.3455 

_ Opérateurs de mutation.3456 

Fractales . 3465 

- Fractales IFS . 3465 

Théorème de Bolzano-Weierstrass.3470 

Espace métrique des fractales.3480 

Fractale de Cantor.3484 

Fractale du triangle de Sierpinski.3486 

Fractale du tapis de Sierpinski.3492 

Fractale spirale.3496 

Fractale de Von Koch.3498 

Fractales naturelles.3501 

Rameau.3502 

Flocon de neige.3504 

Arbre.3507 

Fougère.3509 

Fractales à temps d'échappement.3513 

Ensemble de Mandelbrot.3514 

Ensemble de Julia.3518 

_ Ensemble de Newton.3521 

Systèmes logiques formels . 3527 

Logique stricte.3527 

Algèbre de Boole.3528 

Axiomes.3529 

Théorème des constantes.3530 

Théorèmes du consensus.3531 

Théorèmes de Shannon.3532 

Théorème de De Morgan.3532 

Fonctions logiques.3534 

Tables de Karnaugh.3536 

Opérations arithmétiques booléennes.3539 

Logique floue.3544 

Ensemble flou.3547 

Codes correcteurs . 3554 

Checksum.3556 

Encodeurs.3557 

Distance de Hamming.3557 

Poids de Hamming.3559 

Codes en blocs-linéaires.3561 

Taux de codage.3562 

Matrice génératrice.3563 

Matrice de contrôle.3564 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


XXXVI 







































































Vincent ISOZ [v3.0 - 2013] 


[SCIENCES.CH] 


Codes systématiques. 

.3567 


Cryptographie . 

. 3573 


Principe de Kerchoffs. 

Trappes . 

Système de chiffrement à clé secrète. 

Schéma de Feistel. 

Système de chiffrement à clé publique. 

Protocole de Diffie-Hellmann. 

Système R.S.A. 

Théorème d'Euler. 

Fonctions de Hachage. 

Fonction de condensation Message Digest MD5. 

Fonction de condensation Secure Hash Algorithm SHA-1. 

Certificats d'authentification. 

Cryptographie quantique. 

Cryptographie alternative. 


.3577 

.3577 

.3578 

.3580 

.3583 

.3585 

.3588 

.3588 

.3600 

.3601 

.3602 

.3603 

.3606 

.3611 


Automates . 3616 


Mise en perspective. 

Machine de Von Neumann. 

Machine de Turing. 

Hiérarchie de Chomsky. 

Langage formel. 

Syntaxe. 

Automates associés. 

Terminologie. 

Mots. 

Langages. 

Équations. 

Codes. 

Codes préfixes. 

Algorithmes linguistiques. 

Algorithme de Huffmann. 

Algorithme de Sardinas et Petterson. 


.3616 

.3617 

.3618 

.3621 

.3621 

.3622 

.3626 

.3626 

.3626 

.3629 

.3631 

.3632 

.3633 

.3634 

.3634 

.3639 


Informatique quantique . 3645 


Polarisation du photon. 

QuBit. 

Sphère de Bloch. 

QuBit de polarisation. 

Base HA/. 

Base D/A. 


.3648 

.3650 

.3656 

.3662 

.3662 

.3663 

.3664 


| Mathématiques sociales. 

.3674 | 

Dynamique des populations . 

. 3675 


Quotient de mortalité. 

Ordre des vivants. 

Renouvellement de la population. 


.3676 

.3679 

.3683 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


XXXVII 













































































Vincent ISOZ [v3.0 - 2013] 


[SCIENCES.CH] 


Modèles de populations.3684 

Modèle exponentiel.3684 

Modèle logistique déterministe.3688 

Modèle logistique chaotique.3691 

Diagramme de Feigenbaum.3696 

Loi de Malthus.3700 

Modèle de Leslie.3701 

Propagation des épidémies.3702 

Modèle Proies-Prédateurs (de Lotka-Volterra).3706 

Modèle de capture optimale de Schaefer.3706 

Modèle de Hardy-Weinberg.3717 

Taux de croissance avec la température.3722 

Théorie de la décision (jeux) . 3728 

Théorie des jeux VS Théorie de la décision.3728 

Types de jeux.3729 

Représentations de jeux.3730 

Forme extensive d'un jeu.3731 

Forme extensive d'une décision.3732 

Forme normale d'un jeu.3738 

Maximin.3742 

Maximax.3742 

Minimax.3742 

Jeux répétitifs.3744 

Forme ensembliste d'un jeu.3745 

Forme graphique d'un jeu.3750 

Jeux coopératifs et non-coopératifs.3753 

Optimum de Pareto.3755 

Équilibre de Nash.3755 

Utilité espérée.3757 

Critère de Hurwitz.3758 

Critère de Laplace.3760 

Jeux évolutionnaires.3761 

Équilibre de Cournot.3767 

_ Chaînes de Markov.3770 

Économie . 3779 

Concepts.3779 

Micro-économie.3780 

Coût moyen et marginal.3785 

Macro-économie.3789 

Modèle de Cobb-Douglas.3789 

Modèle monétaire.3793 

Loi de Say.3795 

Loi de Walras.3796 

Théorie de l'offre et de la demande.3798 

Théorie de la préférence.3798 

Modèle contrarié à perte nette.3804 

Capitalisation et actuariat.3811 

Intervalles de dates.3813 

Équivalences de taux.3817 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


XXXVIII 






























































Vincent ISOZ [v3.0 - 2013] 


[SCIENCES.CH] 


Intérêt simple.3818 

Escompte.3818 

Intérêt composé.3820 

Intérêt continu.3822 

Intérêt progressif (rentes).3824 

Rentes postnumerando.3825 

Rentes praenumerando.3827 

Arrondis.3829 

Emprunts.3829 

Emprunt à échéance fixe.3830 

Emprunt à amortissement constant.3831 

Emprunt à annuité constante.3832 

Théorie moderne des portefeuilles.3834 

Absence d'opportunité d'arbitrage.3836 

Portefeuilles.3839 

Actions.3840 

Modèle d'évaluation de Durand.3842 

Modèle d'évaluation de Gordon-Shapiro.3843 

Obligations.3845 

Courbe de taux.3847 

Valeur actuelle.3849 

Prix obligataire de non-arbitrage.3852 

Bons de souscription.3854 

Contrats à terme.3856 

Pricing des contrats.3857 

Hedging de contrats.3858 

Options.3861 

Types d'options simples.3863 

Effet de levier.3865 

Appel de marge.3866 

Fonds de placement.3869 

Retours et taux d'investissements.3869 

Retum On Investment (ROI).3870 

Internai Rate of Return (IRR).3871 

Money Weighted Rate of Return.3872 

Time Weighted Rate of Return.3874 

Modèle spéculatif de Bachelier.3876 

Espérance et variance positive.3880 

Modèle de diversification efficient de Markowitz.3884 

Frontière efficient de Markowitz.3387 

Portefeuille global de variance minimum.3894 

Capital Market Line (C.M.L.).3894 

Modèle de diversificaiton efficient de Sharpe.3898 

Coefficient bêta.3898 

Coefficient alpha.3901 

Ratio de Sharpe.3906 

Tracking error.3907 

Modèle d'évaluation des actifs financiers (MEDAF).3912 

Taux de rendement certain.3915 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


XXXIX 























































Vincent ISOZ [v3.0 - 2013] 


[SCIENCES.CH] 


Capital Market Line (C.M.L.).3916 

Security Market Line (S.M.L.).3919 

Prime de risque.3920 

Spread de crédit.3920 

Modèle d'évaluation des options de Black & Scholes.3920 

Équation de parité Call-Put.3921 

Hypothèse d'efficient du marché.3923 

Processus de Wiener.3924 

Mouvement brownien standard.3925 

Mouvement brownien généralisé.3298 

Pont brownien.3932 

Processus d'Itô.3935 

Mouvement brownien géométrique.3935 

Théorème d'Itô-Doeblin.3938 

Modèle de Bachelier-Samuelson.3941 

Équation de Black & Scholes (Merton).3945 

Équation différentielle de Black & Scholes (à coeff. non constants).3947 

Portefeuille autofinançant sur sous-jacent risqué.3947 

Les Grecques et autres.3948 

Résolution de l'E.D.P. de Black & Scholes.3951 

Équation différentielle partielle à coeff. constants.3954 

Forme de diffusion de l'E.D.P.3958 

Value At Risk (V@R).3959 

VaR relative.3960 

VaR absolue.3963 

VaR historique.3964 

VaR de crédit.3965 

VaR opérationnelle.3966 

VaR variance-covariance.3968 

Back-testing de la VaR (modèle binomial).3969 

Analyse des séries temporelles (A.S.T.).3970 

Types d'erreurs.3975 

Décomposition.3976 

Modèles prévisionnels déterministes.3983 

Moyenne mobile simple (lissage par moyenne mobile).3984 

Modèle linéaire avec coefficients saisonniers.3986 

Lissage exponentiel simple.3989 

Lissage exponentiel double à un paramètre (méthode de Brown).3999 

Lissage exponentiel double à deux paramètres de Holt (modèle additif).4007 

Lissage exponentiel triple à 3 paramètres de Holt et Winters (multiplicatif).4012 

Modèles autorégressifs.4025 

Coefficient d'autocorrélation.4028 

Corrélogramme.4029 

Processus autorégressifs AR(p).4033 

Processus autorégressifs MA(q).4035 

Processus ARMA(p,q).4036 

Processus ARIMA(p,d,q).4037 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


XL 





















































Vincent ISOZ [v3.0 - 2013] 


[SCIENCES.CH] 


Techniques de gestion . 4045 

Analyse du seuil de rentabilité.404/ 

Diagramme de Pareto.4049 

Indice de Gini.4053 

PERT probabiliste.4056 

Loi bêta de première espèce.4057 

Estimation à deux points.4061 

Processus Six Sigma (lean).4062 

Rendement global combiné.4063 

Modèle statistique de contrôle des salaires.4066 

Gestion de stocks.4067 

Stocks en avenir incertain.4069 

Stock initial en gestion calendaire et à rotation nulle.4070 

Modèle de Wilson.4070 

Modèle de Wilson avec réapprovisionnement.4083 

Relations d'optimalité.4088 

Modèle de Wilson sans réapprovisionnement.4091 

Relations d'optimalité.4094 

Modèle de Wilson avec réapprovisionnement et rupture.4094 

Relations d'optimalité.4098 

Analyse de la sensibilité.4099 

Biens d'équipement.4103 

Amortissement linéaire.4103 

Amortissement arithmétique dégressif.4104 

Amortissement géométrique dégressif.4105 

Choix d'investissements.4106 

Valeur actuelle nette (VAN).4106 

Taux de rentabilité interne (TRI).4109 

Délai de récupération et d'amortissement.4110 

Théorie des files d'attentes.4110 

Modélisation des durées d'arrivées M/M/.4113 

Fonction de répartition d'Erlang.4116 

PASTA.4116 

Modélisation des durées de service.4119 

Notation de Kendall.4121 

Modélisation des arrivées et départs M/M/1.4122 

Relation de Little.4126 

Probabilité de mise en attente M/M/K/K (formule d'Erlang-B).4128 

Probabilité de mise en attente M/M/K/inf (formule d'Erlang-C).4132 

Assurances.4136 

Calcul de prime.4137 

Prise en compte de l'expérience.4139 

Facteur d'actualisation d'une assurance retraite.4142 

Assurances de rentes.4145 

Rente viagère temporaire.4146 

Rente viagère différée.4147 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


XLI 


























































Vincent ISOZ [v3.0 - 2013] 


[SCIENCES.CH] 


Musique mathématique . 4153 

Undes sonores longitudinales.4153 

Relation de Newton-Laplace.4157 

Puissance transportée par une onde sonore.4159 

Mesure de l'intensité du son.4163 

Ondes sphériques.4166 

Effet Doppler.4166 

Source fixe-Observateur en mouvement.4166 

Source en mouvement-Observateur fixe.4168 

Observateur et Source en mouvement.4170 

Ondes de choc.4170 

Gammes musicales.4171 

Oscillateur harmonique.4173 

Oscillateur forcé.4176 



Horizon visuel.4182 


Direction des vents.4184 

Modèle atmosphérique exponentiel.4186 

Équilibre hydrostatique.4186 

Modèle atmosphérique adiabatique.4189 

Équation hypsométrique.4192 

B allon- sonde.4193 

Cyclogenèse et anticyclogenèse.4197 

Cellules de Hadley.4197 

Équilibre géostrophique.4198 

Paramètre de Coriolis.4200 

Nombre de Rossby.4201 

Équation des vents.4202 

Marées.4204 

Première approche.4204 

Force de marée statique.4205 

Deuxième approche.4207 

Équation de Lorenz.4212 

Coefficient de Lamé.4216 

Tenseur des taux de déformation.4219 

Rouleaux de convection de Rayleigh-Bénard.4223 

Nombre de Prandtl.4229 

Nombre de Rayleigh.4230 

Attracteurs étranges.4231 

Vagues.4235 

Profondeur des vagues.4246 

_ Amplitude des vagues.4247 

Génie mécanique . 4253 

Engrenages .4253 

Rapports de transmission.4255 

Association d'engrenages.4259 

Résistance des matériaux (R.D.M.).4264 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


XLII 







































































Vincent ISOZ [v3.0 - 2013] 


[SCIENCES.CH] 


Moment quadratiques.4267 

Équation de la ligne élastique.4269 

Équation des poutres (Euler-Bernoulli).4275 

Énergie potentielle élastique.4281 

Torsion .4282 

Ressort de compression.4285 

Flambage.4286 

Formule d’Euler.4289 

_ Traction .4289 

Génie électrique . 4295 

Quelques symboles de base.4295 

Courant alternatif vs Courant continu.4298 

Puissance moyenne.4300 

Courant RMS.4301 

Puissance active.4303 

Puissance réactive.4303 

Puissance apparente.4303 

Transformateur.4304 

Circuits linéaires en régime constant.4307 

Circuit RC série.4307 

Constante de temps.4308 

Circuit RL série.4311 

Circuit RLC série.4314 

Résistance critique.4315 

Régime critique.4315 

Régime apériodique.4317 

Régime pseudo-périodique (ou des oscillations amorties).4319 

Facteur d'amortissement.4322 

Pulsation propre.4322 

Circuits linéaires en régime forcé.4323 

Filtre passe-bas passif.4326 

Filtre passe-haut passif.4328 

_ Intégrateur et dérivateur.4330 

Génie civil . 4336 

Statique.4336 

Poulies.4337 

Poulie simple mobile.4339 

Poulies composées.4340 

Spirale de Cornu.4344 

Câbles suspendus.4348 

Câble suspendu libre (chaînette).4348 

Courbe caténaire.4351 

Câble suspendu porteur (pont suspendu).4356 

Câble très tendu.4359 

Barrages.4360 

Génie aérospatial . 4336 

Vitesse cosmologique.4368 

Première vitesse cosmique.4368 

Deuxième vitesse cosmique.4368 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


XUII 







































































Vincent ISOZ [v3.0 - 2013] 


[SCIENCES.CH] 


Équation fondamentale de la propulsion.4371 

Formule de Tsiolkovski.4372 

Orbite géostationnaire.4379 

Génie industriel . 4386 

- Six Sigma . 4387 

Contrôle qualité.4389 

Défauts/Erreurs.4390 

Defects Per Unit.4391 

Defects Per Opportunity.4391 

Rendement Global Combiné.4393 

Indices de capabilité.4395 

Capabilité potentielle court terme.4396 

Performance long terme.4398 

Capabilité potentielle décentrée court terme.4401 

Capabilité décentrée moyenne court terme.4406 

Capabilité de processus de contrôle.4406 

Niveaux de qualité.4409 

Modèle de Taguchi.4421 

Le nominal est le meilleur.4424 

Le plus petit est le meilleur.4425 

Le plus grand est le meilleur.4426 

Maintenance préventive.4427 

Obsolescence programmée.4427 

Estimateurs empiriques.4428 

Modèle de Weibull.4441 

Distribution de Weibull à 2 paramètres.4442 

Distribution de Weibull à 1 paramètre.4442 

Topologie des systèmes.4447 

Topologie série.4447 

Topologie parallèle.4449 

Topologie k/n.4451 

Topologie série/parallèle et parallèle/série.4453 

Topologie complexe.4454 

Arbres de défaillances probabilistes.4458 

Méthode du maximum de vraisemblance.4459 

Modèle de survie de Kaplan-Meier.4461 

Méthode ABC.4466 

Plans d'expérience.4470 

Plans factoriels complets.4479 

Matrice d'expérimentation/effets.4481 

Notation de Yates.4482 

Algorithme de Yates et Hunter.4484 

Matrice de Hadamard.4485 

Plans de Plackett-Burman.4486 

Plans factoriels fractionnaires.4489 

Méthode de Box et Hunter.4492 

Contrastes.4493 

Alias.4493 

Générateur.4494 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


xuv 





























































Vincent ISOZ [v3.0 - 2013] 


[SCIENCES.CH] 


Plans de résolution III.4495 

Plans de résolution IV.4495 

Plans de résolution V.4495 

Plans et nomenclature de Taguchi.4498 

Contrôle de réception.4514 

Plan d'échantillonnage par mesure simple avec tolérance unique et a connu.4517 

Risque du fournisseur.4518 

Risque du client.4518 

Calcul des paramètres par utilisation de la norme AF-X06-023.4524 

Niveau de qualité acceptable.4524 

Plan d'échantillonnage simple par attributs.4526 

Monographe binomial de Larson.4530 

Calcul des paramètres par utilisation de la norme ISO 2859-1.4533 

Courbe d'efficacité.4534 

Cartes de contrôles (CC) de la qualité.4537 

Règles empiriques de la WECO.4539 

Echantillonnage.4541 

Cartes de contrôles qualitatives (aux attributs).4542 

Carte de contrôle P.4542 

Carte de contrôle NP.4546 

Carte de contrôle C.4548 

Carte de contrôle U.4551 

Cartes de contrôles quantitatives (aux mesures).4554 

CC à valeurs individuelles avec limites imposées (fixes).4554 

CC à valeurs individuelles avec moyenne et écart-type court terme.4556 

CC avec moyennes basées sur l'erreur standard.4561 

CC avec écarts-types (S Barre - S).4566 

CC avec moyennes basées sur l'écart-type (X Barre - S).4573 

CC avec étendues (R Barre - R).4577 

CC avec moyennes basées sur l'étendue (X Barre - R).4580 

Cartes de contrôles quantitatives autocorrélées (aux mesures).4584 

CC à valeurs individuelles basées sur l'étendue mobile (I-EM X Barre).4585 

CC à valeurs individuelles avec étendue mobile (I-EM Barre).4589 

CC moyennes mobiles (MA).4593 

CC Cusum avec V-Maque empirique.4596 

CC EWMA (pondération exponentielle avec moyenne mobile) avec limites fixes.4603 

Carte de contrôle des fréquences avec limites probabilistes.4610 

Poisson arrivais see time average (PASTA).4612 

_ Carte de contrôle des événements rares (carte-G).4615 

Génie logiciel . 4622 

Algorithme PageRank de Google.4622 

Comptage pondéré.4624 

Comptage récursif.4625 

États absorbants.4631 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


XLV 
























































Vincent ISOZ [v3.0 - 2013] 


[SCIENCES.CH] 


Biographies.4638 | 

Chronologie.4730 1 

Humour.4763 | 


Situations.4763 

Mathématiques.4772 

Physique.4781 

Statistiques.4791 

Économie.4792 

Chimie.4792 

Ingénierie.4997 

Informatique.4801 

Généralités.4808 


| Références 


Remerciements. 

Références bibliographiques 
D.V.D. 


4811 


4811 

4812 
4817 


Liens Internet.4818 


Sciences exactes. 

Éditions-Magazines 

Associations. 

Emplois. 

TV-Radio. 

Divers sciences. 

Logiciels. 


Citations 


À propos 


4818 

4820 

4823 

4824 

4825 

4826 

4827 


4830 


4838 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


XLVI 












































[SCIENCES.CH] 


Le présent site document a été conçu de façon à ce que les connaissances requises 
pour le parcourir soient les plus élémentaires possibles . Il n'est donc pas nécessaire 
d'avoir obtenu un doctorat pour le consulter, il suffit de savoir raisonner, d'avoir 
l'esprit critique, d'observer et d'avoir du temps... 



"La simplicité est le sceau de la vérité et celle-ci resplendit de beauté" 


Omniprésente dans l'industrie (aérospatiale, imagerie, cryptographie, transports, chimie,...), ou dans les 
services (banques, assurances, ressources humaines, projets, logistique, architecture, 
télécommunications,...), la mathématique appliqués apparait aussi dans de nombreux autres secteurs: 
sondages, modélisation des risques, protection des données.. .Elle intervient dans notre vie quotidienne 
(télécommunications, transports, médecine, météorologie, musique...) et contribue à la résolution de 
problématiques actuelles: énergie, santé, environnement, climatologie, optimisation, développement 
durable.. .Son grand succès est donc sa fantastique dispersion dans le monde réel et son intégration 
croissante à toutes les activités humaines. Nous allons donc vers une situation où la mathématique 
n'aura plus le monopole de la mathématique, mais où des économistes, gestionnaires et marchands 
feront tous de la mathématique. 

À ce titre, ancien étudiant dans le domaine de l'ingénierie, j'ai souvent regretté l'absence d'un ouvrage 
unique assez complet, détaillé (sans aller dans l'extrême des puristes...) et pédagogique si possible 
gratuit (!) et portatif (étant personnellement un adepte des liseuses électroniques...) contenant au moins 
une idée non exhaustive de l'ensemble du programme de mathématique appliquée des écoles 
d'ingénieurs et présentant une vue d'ensemble de ce qui est utilisé dans la réalité des entreprises avec 
des démonstrations plus intuitives que rigoureuses mais avec suffisamment de détails afin d'éviter au 
lecteur des efforts inutiles. Un ouvrage aussi qui ne nécessite pas non plus de devoir s'adapter chaque 
fois à une nouvelle notation ou au vocabulaire spécifique à l'auteur quand il ne s'agit pas de changer 
carrément de langue... et où tout un chacun peut proposer des améliorations ou des compléments. 

J'ai été de plus aussi frustré pendant mes études de devoir ingurgiter assez souvent des "formules" ou 
des "lois" soit disant (et à tort) indémontrables ou trop compliquées selon mes professeurs ou même 
déçu par des livres d'auteurs renommés (dont les développements sont laissés au soin du lecteur ou 
comme exercice...). Sur ce site Internet et le PDF associé, prédomine la volonté de ne jamais dérouter 
le lecteur par des formules creuses du style "il est évident que...", "on démontre facilement que...", 
"nous laissons le soin au lecteur de vérifier en tant qu'exercice que...", puisque tous les développements 
y sont présentés en détails. Mais je ne suis pas un puriste des maths! Je n'ai qu'une ambition: expliquer 
de la manière la plus simple possible. 

Bien que je doive admettre que la démonstration de certaines relations présentées dans le cadre des 
cursus des écoles d'ingénieurs ne puisse se faire faute de temps dans le planning scolaire ou de place 
dans un livre, je ne peux accepter qu'un professeur ou un auteur dise à son étudiant (respectivement, 
son lecteur) que certaines lois sont indémontrables (car la plupart du temps c'est faux) ou que telle ou 
telle démonstration est trop compliquée sans lui donner une référence bibliographique (où l'étudiant 
puisse trouver l'information nécessaire à satisfaire sa curiosité) ou au moins une démonstration 
infiniment simplifiée et satisfaisante. 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 








Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

Par ailleurs, j'estime totalement archaïque le fait que certains professeurs continuent de faire prendre 
des notes de cours de manière massive à leurs étudiants. Il serait beaucoup plus favorable et optimal de 
distribuer un support de cours contenant tous les détails et ce afin de pouvoir se concentrer sur 
l'essentiel avec les élèves c'est-à-dire les explications orales, l'interprétation, la compréhension, le 
raisonnement et la mise en pratique plutôt que la copie de tableau noir à outrance... Bien évidemment 
donner un support de cours complet fait que certains étudiants brillent par leur absence mais... c'est tant 
mieux! Ainsi, ceux qui sont passionnés peuvent approfondir les sujets à la maison ou à la bibliothèque 
universitaire, les médiocres feront ce qu'ils ont à faire et pour le reste (élèves en difficultés mais 
travailleurs) ils suivront le cours donné par le professeur pour profiter de poser des questions plutôt que 
de recopier bêtement un tableau noir. 

Pour me baser sur un modèle d'apprentissage d'un spécialiste américain, dont j'ai oublié le nom..., le 
présent site Internet (et son PDF associé) propose et impose les propriétés suivantes à son lecteur: 
découvrir, mémoriser, citer, intégrer, expliquer, reformuler, déduire, choisir, utiliser, décomposer, 
comparer, interpréter, juger, argumenter, modéliser, élaborer, créer, rechercher, raisonner, développer et 
ce dans une démarche claire, pédagogique et progressive permettant de développer l'esprit d'analyse et 
d'ouverture. 

Alors, dans mon esprit, ce site Internet (et son PDF associé) doit pouvoir se substituer, gratuitement, à 
de nombreuses références et lacunes du système, permettant ainsi à tout étudiant curieux de ne pas être 
frustré pendant de longues années durant son cursus de formation. Sans quoi, la science de l'ingénieur 
pourrait alors avoir l'aspect rébarbatif d'une science figée, à l'écart de l'évolution scientifique et 
technique, d'une accumulation hétéroclite de connaissances et surtout de formules qui la font 
considérer comme un sous-produit insipide des mathématiques et qui amène dans les entreprises à de 
nombreux faux résultats... 

Ceux qui ne voient la mathématique appliquée que comme un outil (ce qu'elle est aussi), ou comme 
l'ennemi des croyances religieuses, ou encore comme un domaine scolaire rébarbatif, sont légion. Il est 
cependant peut-être utile de rappeler que, comme le disait Galilée, "le livre de la Nature est écrit dans 
le langage des mathématiques" (sans vouloir faire de scientisme!). C'est dans cet esprit que ce site 
Internet (et son PDF associé) aborde la mathématique appliquée pour les étudiants en sciences de la 
Nature, de la Terre et de la Vie, ainsi que pour tous ceux qui exercent une profession liée à ces diverses 
matières y compris la philosophie ou pour toute personne curieuse de s'informer de l'implication des 
sciences dans la vie quotidienne. 

Le choix de traiter l'ingénierie ici comme une branche de la mathématique appliquée provient 
certainement du fait que l'ensemble des domaines de la physique (anciennement dénommée 
"philosophie naturelle") et la mathématique sont à ce jour tellement peu discernables que la médaille de 
Fields (la plus haute récompense de nos jours dans le domaine de la mathématique) a été décernée en 
1990 au physicien Edward Witten, qui a utilisé des idées physiques pour redémontrer un théorème 
mathématique. Cette tendance n'est certainement pas fortuite, car nous pouvons observer que toute 
science, dès qu'elle cherche à atteindre une compréhension plus détaillée du sujet qu'elle étudie, voit 
finalement toujours sa course aboutir dans la mathématiques pure (la voie absolue par excellence...). 
Ainsi, pouvons-nous présager dans un futur lointain, la convergence de toutes les sciences (pures, 
exactes ou sociales) vers la mathématique pour la modélisation (lire à titre d'exemple le document PDF 
"L'explosion des mathématiques" disponible dans la rubrique Téléchargement du site). 

Il peut parfois nous paraître difficile (à cause d'une crainte aussi obscure et irrationnelle que non 
justifiée des sciences pures chez une importante fraction de nos contemporains) de transmettre le 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


2/4839 






Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

sentiment de beauté mathématique de la nature, de son harmonie la plus profonde et de la mécanique 
parfaitement huilée de TUnivers, à ceux qui ne connaissent que les rudiments du calcul formel. Le 
physicien R. Feynman a parlé un jour de "deux cultures": les gens qui ont, et ceux qui n'ont pas eu une 
compréhension suffisante des mathématiques pour apprécier la structure scientifique de la nature. Il est 
bien dommage qu'il y faille cependant des mathématiques et que celles-ci aient aussi mauvaise 
réputation. Pour l'anecdote, on prétend qu'un roi ayant demandé à Euclide de lui enseigner la géométrie 
se plaignit de sa difficulté. Euclide répondit: "il n'y a pas de voie royale". Les physiciens et 
mathématiciens ne peuvent se convertir à un autre langage. Si vous voulez apprendre à connaître la 
nature, à l'apprécier à sa juste valeur, vous devez comprendre son langage. Elle ne se révèle que sous 
cette forme et nous ne pouvons être prétentieux au point de lui demander de changer. 

Au même titre, aucune discussion intellectuelle ne vous permettra de communiquer à un sourd ce que 
vous ressentez vraiment en écoutant de la musique. De même, toutes les discussions du monde 
resteront impuissantes à transmettre une compréhension intime de la nature à ceux de "l'autre culture". 
Les philosophes et théologiens peuvent essayer de vous donner des idées qualitatives sur l'Univers. Le 
fait que la méthode scientifique (au sens plein du terme) ne puisse convaincre le monde entier de sa 
justesse et de sa pureté, trouve peut-être sa cause dans l'horizon limité de certaines gens qui sont 
amenés à s'imaginer que l'homme ou qu'un autre concept intuitif, sentimental ou arbitraire est le centre 
de l'Univers (principe anthropocentrique). 

Certes, dans le but de partager ce savoir mathématique, il est paradoxal de vouloir augmenter, avec 
notre travail, la liste déjà longue des ouvrages disponibles dans les bibliothèques, dans le commerce et 
sur l'Internet. Néanmoins, il faut être en mesure de présenter une argumentation solide qui justifie la 
création d'un tel site Internet (et son PDF associé) en comparaison à des ouvrages comme ceux de 
Feynman, Landau ou de Bourbaki. Voici donc les quelques arguments qui paraissent cependant 
susceptibles d'être présentés: 

1. Le grand plaisir que je prends à cette entreprise ("garder la main" et progresser). 

2. La passion du partage gratuit et sans frontières de la connaissance (et en français...). 

3. Le caractère évolutif et pratique d'un site Internet libre (outils de recherche efficaces). 

4. Le contenu évolutif en fonction de la demande! ! ! 

5. La présentation rigoureuse avec des démonstrations simplifiées de beaucoup de concepts. 

6. La présentation du plus grand nombre d'outils mathématiques utilisés dans les entreprises. 

7. La possibilité pour les étudiants et professeurs de réutiliser le contenu par copier/coller. 

8. Une notation constante et fixe, dans tout l'ouvrage, pour les opérateurs mathématiques, un 
langage clair et rigoureux sur tous les sujets abordés (critère des 3.C.: clair, complet et concis). 

9. Rassembler le maximum d'informations sur les sciences pures et exactes en un seul ouvrage 
électronique (portatif), homogène et rigoureux. 

10. Dégager, de toutes les pseudo-vérités, les seules vérités qui se démontrent. 

11. Tirer bénéfice de l'évolution des méthodes pédagogiques scolaires qui utilisent l'Internet pour 
chercher la solution à des problèmes de mathématiques. 

12. L'amélioration spectaculaire des logiciels automatiques de traduction et de la puissance des 
ordinateurs qui feront de ce site Internet (et son PDF associé), je le souhaite, une référence dans 
les domaines des sciences dures. 

Et aussi... je considère que les résultats de la recherche individuelle sont la propriété de l'humanité et 
qu'ils doivent être mis à la disposition de tous ceux qui explorent où que ce soit les phénomènes de la 
nature. De cette façon le travail de chacun profite à tous, et c'est pour toute l'humanité que s'amassent 
nos connaissances ce qui est dans la tendance que permet l'Internet. 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


3/4839 






Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

Je ne cache pas, que ma contribution se limite en grande partie à ce jour à celle d'un collectionneur qui 
glane ses informations dans les ouvrages des maîtres ou dans les publications ou pages Internet 
d'anonymes et qui complète et argumente les développements en les améliorant quand ceci est encore 
possible. Quant à ceux qui voudraient m'accuser de plagiat, ils devraient réfléchir au fait que les 
théorèmes présentés dans la plupart des ouvrages payants et disponibles dans le commerce ont été 
découverts et rédigés par leurs illustres prédécesseurs et que leur propre apport personnel a aussi 
constitué, comme le mien, à mettre toutes ces informations sous une forme claire et moderne quelques 
centaines d'années plus tard. De plus, il peut être vu comme douteux que l'on fasse payer l'accès à une 
culture qui est certainement la seule véritablement valable et juste dans ce bas monde et sur lequel il n'y 
a ni brevet, ni droit à la propriété intellectuelle. 

Ce site Internet (et son PDF associé) reflète aussi mes propres limites intellectuelles. Bien que je 
m'efforce d'étudier autant de domaines scientifiques et mathématiques que possible, il est impossible de 
tous les maîtriser. Le site Internet (et son PDF associé) indique clairement mes propres intérêts et 
expériences en tant que consultant, mais aussi mes points forts et mes points faibles. Je suis responsable 
du choix des entrées, ainsi que, bien sûr, des éventuelles erreurs et imperfections. 

Après avoir tenté un ordre de présentation rigoureux (linéaire) du sujet, j'ai décidé d'arranger ce site (et 
son PDF associé) dans un ordre plus pédagogique (thématique) et toujours avec des exemples 
d'applications concrets. Il est à mon avis très difficile de parler d'un si vaste sujet dans un ordre 
purement mathématique en une seule vie, c'est-à-dire lorsque les notions sont introduites une à une, à 
partir de celles déjà co nn ues (où chaque théorie, opérateur, outil, etc. n'apparaîtrait pas avant sa 
définition). Un tel plan nécessiterait de couper le site (et son PDF associé), en morceaux qui ne sont 
plus thématiques. J'ai donc pris la décision de présenter les choses par ordre logique et non par ordre de 
nécessité. Le lecteur se heurtera donc, comme le rédacteur s'y est heurté, à l'extrême complexité du 
sujet. 

Les conséquences de ce choix sont les suivantes: 

1. Il faudra parfois admettre provisoirement certaines choses, quitte à les comprendre plus tard. 

2. Il sera probablement nécessaire pour le lecteur de parcourir au moins deux fois l'ensemble de 
l'ouvrage. Lors de la première lecture, on appréhende l'essentiel et lors de la deuxième lecture, on 
comprend les détails (je félicite celui qui comprendrait toutes les subtilités du premier coup). 

3. Il faut accepter le fait que certains sujets se répètent et qu'il y ait de nombreuses références 
croisées ainsi que remarques complémentaires. 

Certains savent que pour chaque théorème et modèle mathématique, il existe quasiment toujours 
plusieurs méthodes de démonstration. J'ai toujours tenté de choisir celle qui me semblait la plus simple 
(par exemple en relativité il y a la présentation algébrique et matricielle et idem en physique quantique). 
L'objectif étant d'arriver de toute façon au même résultat. 

Ce site (et son PDF associé) étant encore en cours de finalisation, il manque forcément des vérifications 
de convergences, de continuité et autres... (ce qui fera grimper au plafond les mathématiciens...) ! J'ai 
cependant évité (ou, dans le cas contraire, je le signale) les approximations habituelles de la physique et 
l'utilisation de l'analyse dimensionnelle, en y ayant recours le moins possible. J'essaie également d'éviter 
autant que possible des sujets dont les outils mathématiques n'ont pas au préalable été présentés et 
démontrés avec rigueur dans le corps de l'ouvrage. 

Enfin, cet exposé, perfectible, n'est pas une référence absolue et contient des erreurs. Toute remarque 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


4/4839 






Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

est donc la bienvenue. Je m'appliquerai, dans la mesure du possible, à corriger les faiblesses signalées et 
à apporter les modifications nécessaires au plus vite. 

En revanche, alors que la mathématique est exacte et indiscutable, la physique théorique (ses modèles), 
reste interprétable dans le vocabulaire commun (mais pas dans le vocabulaire mathématique) et ses 
conclusions toutes relatives. Je ne peux que conseiller, lorsque vous parcourrez ce site (ou son PDF 
associé), de lire par vous-même et de ne pas subir d'influences extérieures. Il faut avoir l'esprit très 
(très) critique, ne rien prendre pour acquis et tout remettre en cause sans hésitation. Par ailleurs, le mot 
d'ordre du bon scientifique doit être: "Doute, doute, doute..., doute encore, et vérifie toujours.". Nous 
tenons aussi à rappeler que "rien de ce que l'on peut voir, entendre, sentir, toucher ou goûter, n'est ce 
qu'il a l'air d'être", ne vous fiez dès lors pas à votre expérience quotidienne pour tirer des conclusions 
trop hâtives, soyez critique, cartésien, rationnel et rigoureux dans vos développements, raisonnements 
et conclusions! 

Je tiens à préciser à ceux qui tenteraient de trouver par eux-mêmes les résultats de certains 
développements présents sur ce site (ou de son PDF associé), de ne pas s'inquiéter s'ils n'y arrivent pas 
ou s'ils doutent d'eux à cause du temps passé à la résolution d'une équation ou problème: certaines 
théories qui nous semblent évidentes ou simples aujourd'hui, ont mis parfois plusieurs semaines, 
plusieurs mois, voire plusieurs années, pour être élaborées par des mathématiciens ou physiciens de 
renom! 

J'ai également tenté de faire en sorte que ce site (et son PDF associé) soit agréable à l'oeil et à parcourir. 
Les concepteurs web professionnels voudront cependant bien excuser la mauvaise qualité du code 
HTML / PHP (qu'ils ne verront pas en partie...) / Javascript / CSS et l'abus de l'utilisation du biseautage 
et estampage de Photoshop ainsi que le choix d'une interface optimisée pour une résolution de 1024 x 
768 et supérieure, mais le temps me manque pour épurer le code et réaliser des finitions graphiques 
correctes (de plus, je privilégie plutôt la qualité du contenu que le contenant). 

Enfin, j'ai choisi d'écrire cet exposé à la première personne du pluriel ("nous"). Effectivement, la 
mathématique-physique n'est pas une science qui s'est faite ou évoluera grâce à un travail individuel 
mais à l'aide d'une collaboration intensive entre personnes reliées par la même passion et le même désir 
du Savoir. Ainsi, en faisant usage du "nous", il est rendu hommage aux hommes de science disparus, 
aux contemporains et aux futurs chercheurs pour le travail qu'ils effectueront dans le but de s'approcher 
de la vérité et de la sagesse. 

1. MÉTHODES 


La science est l'ensemble des efforts systématiques (observations scrupuleuses et hypothèses 
vraisemblables jusqu'à preuve du contraire) pour acquérir des connaissances sur notre environnement, 
pour les organiser et les synthétiser en lois et théories vérifiables et ayant pour principal objectif 
d'expliquer le "comment" des choses (et non pas le pourquoi!) souvent par une démarche à trois étapes: 

- De quoi est-ce que nous disposons? 

- Par où va-t-on passer? 

- Quel est notre objectif? 

Les scientifiques doivent soumettre leurs idées et résultats à la vérification et la reproduction 
indépendante de leurs pairs. Ils doivent abandonner ou modifier leurs conclusions lorsque confrontées à 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


5/4839 







Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

des évidences plus complètes ou différentes. La crédibilité de la science s'appuie sur ce mécanisme 
d'autocorrection. L'histoire de la science montre que ce système fonctionne depuis très longtemps et ce 
même très bien par rapport à tous les autres. Dans chaque domaine, les progrès ont été spectaculaires. 
Toutefois, le système a parfois des ratés qu'il faut corriger avant que les petites dérives ne s'accumulent. 

Le bémol est que les scientifiques sont des hommes. Ils ont les défauts de tous les hommes et, en 
particulier, la vanité, l'orgueil et la fatuité. De nos jours, il arrive que plusieurs personnes travaillant sur 
un même sujet depuis un certain temps développent une foi commune et croient qu'ils détiennent la 
vérité. Le chef de file de cette foi devient le Pape et distille des grands-messes. Le Pape qui se prend au 
jeu, prend sa mitre et son bâton de pèlerin pour évangéliser ses collègues hérétiques. Jusque-là, cela 
prête à sourire. Mais, comme dans les vraies religions, ils ont parfois la fâcheuse tendance de vouloir 
s'étendre au détriment de ceux qui ne croient pas. Certaines de ces "Eglises" n'hésitent pas à se 
comporter comme l'Inquisition. Ceux qui osent émettre une opinion différente se font incendier à 
chaque occasion, lors des congrès, voire sur leur lieu de travail. Certains jeunes chercheurs, en mal 
d'inspiration, préfèrent se convertir à cette religion dominante, pour devenir plus rapidement des 
dignitaires religieux à peu de frais, plutôt que des chercheurs innovants, voire iconoclastes. Le grand 
Pape écrit sa Bible pour diffuser sa pensée, l'impose à lire aux étudiants et aux nouveaux venus. Il 
formate ainsi la pensée des jeunes générations et assure son trône. C'est une attitude moyenâgeuse qui 
peut bloquer le progrès. Certains Papes vont jusqu'à croire que le fait d'être pris pour le pape dans un 
domaine leur donne automatiquement le même trône dans tous les autres domaines... 

Cet avertissement, et les rappels qui vont suivre, doivent servir le scientifique à se remettre en question 
en faisant un bon usage de ce que nous pouvons considérer aujourd'hui comme les bonnes méthodes de 
travail (nous parlerons des principes de la méthode de Descartes plus loin) pour résoudre des problèmes 
ou développer des modèles théoriques. 

Dans ce but, voici un tableau récapitulatif qui propose les différentes étapes que le scientifique devrait 
suivre lors de ses travaux en mathématique ou physique théorique (pour les définitions, voir juste 
après): 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


6/4839 






Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


MATHÉMATIQUE 

PHYSIQUE 

1. Poser "l'hypothèse", la "conjecture" la 
"propriété" à démontrer de manière formelle ou en 
langage commun (les hypothèses étant notées Hl., 
H2.,... les conjectures CJ1., CJ2.,... et les 
propriétés PL, P2.,...)) 

1. Poser correctement et de manière détaillée le ou 
les "problèmes" à résoudre de manière formelle ou 
en langage commun (les problèmes étant notés 

PL, P2.,...) 

2 . Définir les "axiomes" (sous-entendu 
non-démontrables, indépendants et 
non-contradictoires) qui vont donner les points de 
départ et établir des restrictions aux 
développements (les axiomes étant notés Al., A2, 
...). 

2 . Définir (ou énoncer) les "postulats" ou 
"principes" ou encore les "hypothèses" et 
"suppositions" (supposés non démontrables...) qui 
vont donner les points de départ et établir des 
restrictions aux développements (habituellement, 
les postulats et principes sont notés PL, P2.,... et 
les hypothèses Hl., H2.,... en essayant d'éviter 
pour les postulats et principes, une confusion 
possible avec l'énoncé du ou des problèmes qui 
sont notés de la même manière). 

Remarque : Parfois par abus, "propriétés", 
"conditions" et "axiomes" sont confondus 
alors que le concept d'axiome est beaucoup 
plus précis et profond. 

Remarque : Il ne faut pas cependant oublier 
que la validité d'un modèle ne dépend pas du 
réalisme de ses hypothèses mais bien de la 
conformité de ses implications avec la réalité. 

Dans la même idée, le mathématicien définit le 
vocabulaire spécialisé relié à des opérateurs 
mathématiques qui seront notés par DL, D2., D3., 


3 . Les axiomes posés, tirer directement des 
"lemmes" ou des "propriétés" dont la validité en 
découle directement et qui préparent au 
développement du théorème censé valider 
l'hypothèse ou la conjecture de départ (les lemmes 
étant notés Ll., L2.,... et les propriétés PL, 

P2.,...). 

3 . Une fois le "modèle théorique" développé 
vérifier les équations dimensionnelles pour déceler 
une éventuelle erreur dans les développements 
(ces vérifications étant notées VAL, VA2.,...). 

4 . Une fois le ou les "théorèmes" (notés Tl., T2., 

...) démontrés en tirer des "corollaires" (notés CL, 
C2.,...) et encore des propriétés (notées PL, P2., 
P3.,...). 

4 . Chercher les cas limites (dont les "singularités" 
font partie) du modèle pour en vérifier la validité 
intuitive (ces contrôles aux limites étant notés 

CL1., CL2.,...). 

5. Tester la force ou l'utilité de sa ou ses 
conjectures ou hypothèses en démontrant la 
réciproque du théorème ou en la comparant avec 
des exemples à d'autres théories mathématiques 
pour voir si l'ensemble forme un tout cohérent (les 
exemples étant notés EL, E2.,...). 

5. Tester expérimentalement le modèle théorique 
obtenu et soumettre le travail à comparaison avec 
d'autres équipes de recherche indépendantes. Le 
nouveau modèle doit prévoir des résultats 
expérimentaux observés et jamais observés 
(prédictions permettant de la falsifier). Si le 
modèle est validé alors il prend officiellement le 
statut de "Théorie". 

6 . D'éventuelles remarques peuvent être indiquées 
dans un ordre structuré et notées 
hiérarchiquement Rl., R2.,... 

6 . D'éventuelles remarques peuvent être indiquées 
dans un ordre structuré et notées 
hiérarchiquement Rl., R2.,... 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


7/4839 




























Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

Procéder comme dans le tableau ci-dessus est une base de travail possible pour travailler en 
mathématique et physique. Évidemment, procéder de façon propre et traditionnelle comme ci-dessus 
prend un petit plus de temps qu'en faisant un peu n'importe quoi, n'importe comment (c'est pour cela 
que la plupart des professeurs ne suivent pas ces règles, le temps leur manque cruellement pour couvrir 
tout le programme scolaire). 



processus de 
déduction 


1 

résultats théoriques 


processus 

d'observations 


empiriques 


modification des 
hypothèses 



Signalons aussi une forme amusante scientifique des 8 commandements: 

1. Les phénomènes tu observeras 
Et jamais mesure tu ne falsifieras 

(attention à l'erreur de confirmation: étudier que des phénomènes qui valident ses convictions) 

2. Des hypothèses tu formuleras 

Que par l'expérimentation tu testeras 

3. L'expérience précisément tu décriras 
Car ton collègue la reproduira 

(attention au piège de la discipline narrative: coller les faits aux résultats désirés) 

4. Fort de tes résultats 
Une théorie tu bâtiras 

5. De parcimonie tu useras 

Et l'hypothèse la plus simple tu retiendras 

6. Jamais vérité définitive ne sera (humilité épistémique) 

Et toujours tu chercheras 

7. D'une thèse non réfutable tu t'abstiendras 
Car hors de la science elle restera 

8. Tout échec sera pris comme une réussite 

Car la science doit confirmer mais aussi infirmer 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


8/4839 











Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


Remarques: 

RI. Attention, il est très facile de faire des nouvelles théories physiques en alignant des mots. Cela 
s'appelle de la "philosophie" et les grecs ont pensé aux atomes en suivant cette méthode. Cela peut 
donc mener avec beaucoup de chance à une vraie théorie. Par contre il est bien plus difficile de 
faire une "théorie prédictive", c'est-à-dire avec des équations qui permettent de prédire le résultat 
d'une expérience. 

R2. Toutefois ce qui sépare la mathématique de la physique est que, en mathématique, l'hypothèse 
est toujours vraie. Le discours mathématique n'est pas une démonstration d'une vérité extérieure à 
chercher, mais vise uniquement la cohérence. Ce qui doit être juste est le raisonnement. 


Signalons que lorsque ces règles ne sont pas respectées, nous parlons de "fraude scientifique" (ce qui 
amène souvent à être licencié de son poste mais malheureusement on ne retire pas encore les diplômes 
quand cela arrive). En général, la fraude scientifique à proprement parler se présente sous trois grandes 
formes: le plagiat, la fabrication de données et l'altération de résultats défavorables à l'hypothèse 
avancée, l'omission d'exposition claire des hypothèses de travail et de données récoltées. À ces fraudes 
s'ajoutent des comportements qui posent problèmes concernant la qualité des travaux ou plus 
particulièrement l'éthique, comme ceux visant à augmenter en apparence la production (et par voie de 
fait la renommée du scientifique) en soumettant par exemple plusieurs fois la même publication en 
l'ayant un peu modifiée, les défauts de mentions de conflit d'intérêts, les expériences dangereuses, la 
non conservation des données primaires, etc. 

1.1. MÉTHODE DE DESCARTES 


Présentons maintenant les quatre principes de la méthode de Descartes qui, rappelons-le, est considéré 
comme le premier scientifique de l'histoire de par sa méthode d'analyse: 

PI. Ne recevoir jamais aucune chose pour vraie que je ne la connusse évidemment être telle. C'est- 
à-dire, d'éviter soigneusement la précipitation et de ne comprendre rien de plus en mes jugements que 
ce qui se présenterait si clairement et si distinctement à mon esprit, que je n'eusse aucune occasion de le 
mettre en doute. 

P2. De diviser chacune des difficultés que j'examinerais, en autant de parcelles qu'il se pourrait 
(observations scrupuleuses et hypothèses vraisemblables jusqu'à preuve du contraire), et qu'il serait 
requis pour les mieux résoudre. 

P3. De conduire par ordre mes pensées, en commençant par les objets les plus simples et les plus aisés à 
connaître, pour monter peu à peu comme par degrés jusqu'à la connaissance des plus composés, et 
supposant même de l'ordre entre ceux qui ne se précèdent point naturellement les uns les autres. 

P4. Faire partout des dénombrements si entiers et des revues si générales, que je fusse assuré de ne rien 
omettre. 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


9/4839 










Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

2. VOCABULAIRE 


La physique-mathématique, comme tout domaine de spécialisation, a son vocabulaire propre. Afin que 
le lecteur ne soit pas perdu dans la compréhension de certains textes qu'il pourra lire sur ce site (et son 
PDF associé), nous avons choisi d'exposer ici les quelques termes, abréviations et définitions 
fondamentaux à connaître. 

Ainsi, le mathématicien aime bien ter min er ses démonstrations (quand il pense qu'elles sont justes) par 
l'abréviation "C.Q.F.D" qui signifie "Ce Qu'il Fallait Démontrer" ou encore dans les hautes écoles par 
souci d'esthétisme et de traditions certains professeurs (et mêmes élèves) notent cela en latin "Q.E.D" 
qui signifie "Quod Erat Demonstrandum" (cela en jette...). 

Et lors de définitions (elles sont nombreuses en mathématique et physique...) le scientifique fait souvent 
usage des terminologies suivantes: 


-... il suffit que ... 


-... si et seulement si ... 

-... nécessaire et suffisant... 


-... signifie que ... 


Les quatre ne sont pas équivalentes (identiques au sens strict). Car "il suffit que" correspond à une 
condition suffisante, mais pas à une condition nécessaire. 

2.1. SUR LES SCIENCES 


Il est important que nous définissions rigoureusement les différents types de sciences auxquelles l'être 
humain fait souvent référence. Effectivement, il semble qu'au 21ème siècle un abus de langage malsain 
s'instaure et qu'il ne devienne plus possible pour la population de distinguer la "qualité intrinsèque" 
d'une science d'une autre. 


Remarque : Etymologiquement le mot "science" vient du latin "scienta" (connaissance) dont la 
racine est le verbe "scire" qui veut dire "savoir". 


Cet abus de langage vient probablement du fait que les sciences pures et exactes perdent leurs illusions 
d'universalité et d'objectivité, dans le sens où elles s'auto-corrigent. Ceci ayant pour conséquence que 
certaines sciences sont reléguées au second plan et tentent d'en emprunter les méthodes, les principes et 
les origines pour créer une confusion quant à leurs distinctions. 

En soi, la science cependant ne produit pas de vérité absolue. Par principe, une théorie scientifique est 
valable tant qu'elle permet de prédire des résultats mesurables et reproductibles. Mais les problèmes 
d'interprétation de ces résultats font partie de la philosophie naturelle. 

Étant donné la diversité des phénomènes à étudier, au cours des siècles s'est constitué un nombre 
grandissant de disciplines comme la chimie, la biologie, la thermodynamique, etc. Toutes ces disciplines 
a priori hétéroclites ont pour socle commun la physique, pour langage la mathématique et comme 
principe élémentaire la méthode scientifique. 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


10/4839 










Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

Ainsi, un petit rafraîchissement de mémoire semble nécessaire: 

Définitions: 

Dl. Nous définissons par "science pure", tout ensemble de connaissances fondées sur un raisonnement 
rigoureux valable quel que soit le facteur (arbitraire) élémentaire choisi (nous disons alors "indépendant 
de la réalité sensible") et restreint au minimum nécessaire. Il n'y a que la mathématique (appelée 
souvent "reine des sciences") qui peut être classifiée dans cette catégorie. 

D2. Nous définissons par "science exacte" ou "science dure", tout ensemble de connaissances fondées 
sur l'étude d'une observation, observation qui aura été transcrite sous forme symbolique (physique 
théorique). Principalement, le but des sciences exactes est non d'expliquer le "pourquoi" mais le 
"comment". 


Remarque :Les deux définitions précédentes sont souvent incluses dans la définition de "sciences 
déductives" ou encore de "sciences phénoménologiques". 


D3. Nous définissons par "science de l'ingénieur", tout ensemble de connaissances théoriques ou 
pratiques appliquées aux besoins de la société humaine tels que: l'électronique, la chimie, 
l'informatique, les télécommunications, la robotique, l'aérospatiale, biotechnologies... 

D4. Nous définissons par "science" tout ensemble de connaissances fondées sur des études ou 
observations de faits dont l'interprétation n'a pas encore été retranscrite ni vérifiée avec la rigueur 
mathématique caractéristique des sciences qui précèdent, mais qui applique des raisonnements 
comparatifs statistiques. Nous incluons dans cette définition: la médecine (il faut cependant prendre 
garde au fait que certaines parties de la médecine étudient des phénomènes descriptifs sous forme 
mathématique tels que les réseaux de neurones ou autres phénomènes associés à des causes physiques 
connues), la sociologie, la psychologie, l'histoire, la biologie... 

Selon le philosophe Karl Popper, une théorie n'est scientifiquement acceptable que si, telle qu'elle est 
présentée, elle peut être falsifiable, c'est à dire soumise à des tests expérimentaux. La "connaissance 
scientifique" est ainsi par définition l'ensemble des théories qui ont jusqu'alors résisté à la falsification. 
La science est donc par nature soumise en permanence à la remise en question. 

D5. Nous définissons par "science molle" ou "para-sciences", tout ensemble de connaissances ou de 
pratiques qui sont actuellement fondées sur des faits invérifiables (non reproductibles scientifiquement) 
ni par l'expérience, ni par la mathématique. Nous incluons dans cette définition: l'astrologie, la 
théologie, le paranormal (qui est démoli par la science zététique), la graphologie... 

D6. Nous définissons par "sciences phénoménologiques" ou "sciences naturelles", toute science qui 
n'est pas inclue dans les définitions précédentes (histoire, sociologie, psychologie, zoologie, biologie,...) 

D7. Le "scientisme" est la doctrine fondamentale suivant laquelle il n'y a de vérité que dans la science. 

Ce qui est intéressant dans cette doctrine, c'est que c'est certainement une des seules qui demande aux 
gens de devoir réfléchir par eux-mêmes et de comprendre l'environnement qui les entoure en remettant 
continuellement tout en question et sans ne jamais rien accepter comme acquis (...). De plus, les vraies 
sciences ont ceci d'extraordinaire qu'elles permettent de comprendre au-delà de ce que nous pouvons 
voir. 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


11/4839 









Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

Mais enfin, la science, c'est la science, et rien de plus: une certaine mise en ordre, pas trop mal réussie, 
des choses qui ne conduit plus à la méthaphysique comme du temps d'Aristote, mais qui n'a pas le 
prétention de nous livrer toute la réalité ni même le fond des choses visibles. 

2.2. TERMINOLOGIE 


Le tableau méthodique que nous avons présenté plus haut contient des termes qui peuvent peut-être 
vous sembler inconnus ou barbares. C'est la raison pour laquelle il nous semble fondamental de 
présenter les définitions de ces derniers, ainsi que de quelques autres tout aussi importants qui peuvent 
éviter des confusions malheureuses. 

Définitions: 

Dl. Au-delà de son sens négatif, l'idée de "problème" renvoie à la première étape de la démarche 
scientifique. Formuler un problème est ainsi essentiel à sa résolution et permet de comprendre 
correctement ce qui fait problème et de voir ce qui doit être résolu. 

Le concept de problème est intimement relié au concept "d'hypothèse" dont nous allons voir la 
définition ci-dessous. 

D2. Une "hypothèse" est toujours, dans le cadre d'une théorie déjà constituée ou sous-jacente, une 
supposition en attente de confirmation ou d'infirmation qui tente d'expliquer un groupe de faits ou de 
prévoir l'apparition de faits nouveaux. 

Ainsi, une hypothèse peut être à l'origine d'un problème théorique qu'il faudra formellement résoudre. 

D3. Le "postulat" en physique correspond fréquemment à un principe (voir définition ci-dessous) dont 
l'admission est nécessaire pour établir une démonstration (nous sous-entendons que cela est une 
proposition non-démontrable). 

L'équivalent mathématique (mais en plus rigoureux) du postulat est "l'axiome" dont nous verrons la 
définition plus loin. 

D4. Un "principe" (parent proche du "postulat") est donc une proposition admise comme base d'un 
raisonnement ou une règle générale théorique qui guide la conduite des raisonnements qu'il faudra 
effectuer. En physique, il s'agit également d'une loi générale régissant un ensemble de phénomènes et 
vérifiée par l'exactitude de ses conséquences. 


Remarque : le mot "principe" est utilisé avec abus dans les petites classes ou écoles d'ingénieurs par 
les professeurs ne sachant (ce qui est très rare), ou ne voulant (plutôt fréquent), ou ne pouvant faute 
de temps (quasi exclusivement), pas démontrer une relation. 


L'équivalent du postulat ou du principe en mathématiques est "l'axiome" que nous définissons ainsi: 

D5. Un "axiome" est une vérité ou proposition évidente par elle-même dont l'admission est nécessaire 
pour établir une démonstration. 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


12/4839 











Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


Remarques: 

RI. Nous pourrions dire que c'est quelque chose que nous posons comme une vérité pour le 
discours que nous nous proposons de tenir, comme une règle du jeu, et qu'elle n'a pas forcément par 
ailleurs une valeur de vérité universelle dans le monde sensible qui nous entoure). 

R2. Les axiomes doivent toujours être indépendants entre eux (on ne doit pas pouvoir démontrer 
l'un à partir de l'autre), non contradictoires (nous disons également parfois qu'ils doivent être 
"consistants"). 


D6. Le "corollaire" est un terme malheureusement quasi inexistant en physique (à tort !) et qui est en 
fait une proposition résultant d'une vérité déjà démontrée. Nous pouvons également dire qu'un 
corollaire est une conséquence nécessaire et évidente d'un théorème (ou parfois d'un postulat en ce qui 
concerne la physique). 

D7. Un "lemme" constitue une proposition déduite d'un ou de plusieurs postulats ou axiomes et dont la 
démonstration prépare celle d'un théorème. 


Remarque : Le concept de "lemme" est lui aussi (et c'est malheureux) quasi réservé aux 
mathématiques. 


D8. Une "conjecture" constitue une supposition ou opinion fondée sur la vraisemblance d'un résultat 
mathématique. 


Remarque :Beaucoup de conjectures jouent un rôle un peu comparable à des lemmes, car elles sont 
des passages obligés pour obtenir d'importants résultats. 


D8. Par-delà son sens faible de conjecture, une "théorie" ou "théorème" est un ensemble articulé autour 
d'une hypothèse et étayé par un ensemble de faits ou développements qui lui confèrent un contenu 
positif et rendent l'hypothèse bien fondée (ou tout au moins plausible dans le cas de la physique 
théorique) 

D9. Une "singularité" est une indétermination d'un calcul qui intervient par l'apparition d'une division 
par le nombre zéro. Ce terme est aussi bien utilisé en mathématique qu'en physique. 

D10. Une "démonstration" constitue un ensemble de procédures mathématiques à suivre pour 
démontrer le résultat déjà connu ou non d'un théorème. 

Dll. Si le mot "paradoxe" signifie étymologiquement: contraire à l'opinion commune, ce n'est 
cependant pas par pur goût de la provocation, mais bel et bien pour des raisons solides. Le "sophisme" 
quant à lui, est un énoncé volontairement provocateur, une proposition fausse reposant sur un 
raisonnement apparemment valide. Ainsi parle-t-on du fameux "paradoxe de Zénon", alors qu'il ne 
s'agit que d'un sophisme. Le paradoxe ne se réduit pas à de la fausseté, mais implique la coexistence de 
la vérité et de la fausseté, au point qu'on ne parvient plus à discriminer le vrai et le faux. Le paradoxe 
apparaît alors problème insoluble ou "aporie". 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


13/4839 






















Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


Remarque : Ajoutons que les grands paradoxes, par les interrogations qu'ils ont suscitées, ont fait 
progresser la science et amené des révolutions conceptuelles de grande ampleur, en mathématique 
comme en physique théorique (les paradoxes sur les ensembles et sur l'infini en mathématique, ceux 
à la base de la relativité et de la physique quantique). 


2.3. SCIENCE ET FOI 


Nous verrons qu'en science, une théorie est normalement incomplète, car elle ne peut décrire 
exhaustivement la complexité du monde réel. Il en est ainsi de toutes les théories, comme celle du Big 
Bang (cf. chapitre d'Astrophysique) ou de l'évolution des espèces (cf. chapitre de Dynamique Des 
Populations ou de Théorie Des Jeux). 

Il convient de distinguer différents courants scientifiques: 

- Le "réalisme" est une doctrine où les théories physiques ont pour objectif de décrire la réalité telle 
qu'elle est en soi, dans ses composantes inobservables. 

-"L'instrumentalisme" est une doctrine où les théories sont des outils servant à prédire des observations 
mais qui ne décrivent pas la réalité en soi. 

- Le "fictionnalisme" est le courant où le contenu référentiel (principes et postulats) des théories est un 
leurre, utile seulement pour assurer l'articulation linguistique des équations fondamentales. 

Même si aujourd'hui les théories scientifiques ont le soutien de beaucoup de spécialistes, les théories 
alternatives ont des arguments valables et nous ne pouvons totalement les écarter. Pour autant, la 
création du monde en 7 jours décrite par la Bible ne peut plus être perçue comme un possible, et bien 
des croyants reconnaissent qu'une lecture littérale est peu compatible avec l'état actuel de nos 
connaissances et qu'il est plus sage de l'interpréter comme une parabole. Si la science ne fournit jamais 
de réponse définitive, il n'est plus possible de ne pas en tenir compte. 

La foi (qu'elle soit religieuse, superstitieuse, pseudo-scientifique ou autre) a au contraire pour objectif 
de donner des vérités absolues d'une toute autre nature puisqu'elle relève d'une conviction personnelle 
invérifiable. En fait, l'une des fonctions des religions est de fournir du sens à des phénomènes qui ne 
sont pas explicables rationnellement. Les progrès de la connaissance entraînent donc parfois une remise 
en cause des dogmes religieux par la science. 

A contrario, sauf à prétendre imposer sa foi (qui n'est autre qu'une conviction intimement personnelle et 
subjective) aux autres, il faut se défier de la tentation naturelle de qualifier de fait scientifiquement 
prouvé les extrapolations des modèles scientifiques au-delà de leur champ d'application. 

Le mot "science" est comme nous l'avons déjà mentionné plus haut de plus en plus utilisé pour soutenir 
qu'il existe des preuves scientifiques là où il n'y a que croyance (certaines pages web de ce genre 
prolifèrent de plus en plus). Selon ses détracteurs c'est le cas du mouvement de scientologie. Selon ces 
derniers, nous devrions plutôt parler de "sciences occultes". 

Les sciences occultes et sciences traditionnelles existent depuis l'Antiquité; elles consistent en un 
ensemble de connaissances et de pratiques mystérieuses ayant pour but de pénétrer et dominer les 
secrets de la nature. Au cours des derniers siècles, elles ont été progressivement exclues du champ de la 
science. Le philosophe Karl Popper s'est longuement interrogé sur la nature de la démarcation entre 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


14/4839 










Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

science et pseudoscience. Après avoir remarqué qu'il est possible de trouver des observations pour 
confirmer à peu près n'importe quelle théorie, il propose une méthodologie fondée sur la réfutabilité. 
Une théorie doit selon lui, pour mériter le qualificatif de "scientifique", pouvoir garantir l'impossibilité 
de certains événements. Elle devient dès lors réfutable, donc (et alors seulement) apte à intégrer la 
science. Il suffirait en effet d'observer un de ces événements pour invalider la théorie, et s'orienter par 
conséquent sur une amélioration de celle-ci. 

Enfin, citons Lavoisier: "Le physicien peut aussi, dans le silence de son laboratoire et de son cabinet, 
exercer des fonctions patriotiques; il peut espérer par ses travaux diminuer la masse des maux qui 
affligent bonheur et, n'eût-il contribué, par les routes nouvelles qu'il s'est ouvertes, qu'à prolonger de 
quelques années, de quelques jours, la vie moyenne des hommes, il pourrait aspirer aussi au titre 
glorieux de bienfaiteur de l'humanité." 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


15/4839 






Arithmétique 


Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

La mathématique est la forme ultime d'art contraint (inconnu) 


!. THÉORIE DE LA DÉMONSTRATION 


ous avons choisi de commencer l'étude de la mathématique appliquée par la théorie qui nous 
semble la plus fondamentale et la plus importante dans le domaine des sciences pures et exactes. 

La théorie de la démonstration et du calcul propositionnel (logique) a trois objectifs dans le cadre de ce 
site: 

1. Apprendre au lecteur comment raisonner et à démontrer et cela indépendamment de la spécialisation 
étudiée 

2. Montrer que le processus d'une démonstration est indépendant du langage utilisé 

3. Se préparer à la théorie de la logique et au théorème d'incomplétude de Gôdel ainsi qu'aux automates 

(cf. chapitre d'informatique Théorique). 

Le théorème de Gôdel est le point le plus passionnant car si nous définissons une religion comme un 
système de pensée qui contient des affirmations indémontrables, alors elle contient des éléments de foi, 
et Gôdel nous enseigne que les mathématiques sont non seulement une religion, mais que c'est alors la 
seule religion capable de prouver qu'elle en est une! 



Souvent, quand un étudiant arrive dans une classe supérieure, il a surtout appris à calculer, à utiliser des 
algorithmes mais relativement peu voire pas du tout à raisonner. Pour tous les raisonnements, le support 
visuel est un outil puissant, et les personnes qui ne voient pas qu'en traçant telle ou telle courbe ou 
droite la solution apparaît ou qui ne voient pas dans l'espace sont très pénalisées. 

Lors des études secondaires, nous manipulons déjà des objets inconnus, mais c'est surtout pour faire des 
calculs, et quand nous raisonnons sur des objets représentés par des lettres, nous pouvons remplacer 
ceux-ci visuellement par un nombre réel, un vecteur, etc. A partir d'un certain niveau, nous demandons 
aux personnes de raisonner sur des structures plus abstraites, et donc de travailler sur des objets 
inconnus qui sont des éléments d'un ensemble lui-même inconnu, par exemple les éléments d'un groupe 
quelconque (cf. chapitre de Théorie Des Ensembles). Ce support visuel n'existe alors plus. 

Nous demandons ainsi souvent aux étudiants de raisonner, de démontrer des propriétés, mais personne 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


17/4839 















Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

ne leur a jamais appris à raisonner convenablement, à écrire des preuves. Si nous demandons à un 
étudiant de licence ce qu'est une démonstration, il a très probablement quelque difficulté à répondre. Il 
peut dire que c'est un texte dans lequel on trouve des mots-clés comme: "donc", "parce que", "si", "si et 
seulement si", "prenons un x tel que", "supposons que", "cherchons une contradiction", etc. Mais il est 
incapable de donner la grammaire de ces textes ni même leurs rudiments, et d'ailleurs, ses enseignants, 
s'ils n'ont pas suivi de cours, en seraient probablement incapables aussi. 

Pour comprendre cette situation, rappelons que pour parler un enfant n'a pas besoin de connaître la 
grammaire. Il imite son entourage et cela marche très bien: un enfant de six ans sait utiliser des phrases 
déjà compliquées quant à la structure grammaticale sans avoir jamais fait de grammaire. La plupart des 
enseignants ne connaissent pas non plus la grammaire du raisonnement mais, chez eux, le processus 
d'imitation a bien marché et ils raisonnent correctement. L'expérience de la majorité des enseignants 
d'université montre que ce processus d'imitation marche bien chez les très bons étudiants, et alors il est 
suffisant, mais il marche beaucoup moins bien, voire pas du tout, chez beaucoup d'autres. 

Tant que le degré de complexité est faible (notamment lors d'un raisonnement de type "équationnel"), la 
grammaire ne sert à rien, mais quand il augmente ou quand on ne comprend pas pourquoi quelque 
chose est faux, il devient nécessaire de faire un peu de grammaire pour pouvoir progresser. Les 
enseignants et les étudiants connaissent bien la situation suivante: dans un devoir, le correcteur a barré 
toute une page d'un grand trait rouge et mis "faux" dans la marge. Quand l'étudiant demande ce qui est 
faux, le correcteur ne peut que dire des choses du genre "ça n'a aucun rapport avec la démonstration 
demandée", "rien n'est juste",..., ce qui n'aide évidemment pas l'étudiant à comprendre. Cela vient en 
partie, du fait que le texte rédigé par l'étudiant utilise les mots voulus mais dans un ordre plus ou moins 
aléatoire et qu'on ne peut donner de sens à l'assemblage de ces mots. De plus, l'enseignant n'a pas les 
outils nécessaires pour pouvoir expliquer ce qui ne va pas. Il faut donc les lui donner! 

Ces outils existent mais sont assez récents. La théorie de la démonstration est une branche de la logique 
mathématique dont l'origine est la crise des fondements: il y a eu un doute sur ce que nous avions le 
"droit" de faire dans un raisonnement mathématique (voir la "crise des fondements" plus loin). Des 
paradoxes sont apparus, et il a alors été nécessaire de préciser les règles de démonstration et de vérifier 
que ces règles ne sont pas contradictoires. Cette théorie est apparue au début du 20ème siècle, ce qui 
est très peu puisque l'essentiel des mathématiques enseignées en première moitié de l'université est 
connu depuis le 16ème-17ème siècle. 

1. LA CRISE DES FONDEMENTS 


Pour les premiers Grecs, la géométrie était considérée comme la forme la plus haute du savoir, une 
puissante clé pour les mystères métaphysiques de l'Univers. Elle était plutôt une croyance mystique, et 
le lien entre le mysticisme et la religion était rendu explicite dans des cultes comme ceux des 
Pythagoriciens. Aucune culture n'a depuis déifié un homme pour avoir découvert un théorème 
géométrique! Plus tard, les mathématiques furent considérées comme le modèle d'une connaissance a 
priori dans la tradition aristotélicienne du rationalisme. 

L'étonnement des Grecs pour les mathématiques ne nous a pas quittés, on le retrouve sous la 
traditionnelle métaphore des mathématiques comme "Reine des Science". Il s'est renforcé avec les 
succès spectaculaires des modèles mathématiques dans la science, succès que les Grecs (ignorant même 
la simple algèbre) n'avaient pas prévus. Depuis la découverte par Isaac Newton du calcul intégral et de 
la loi du carré inverse de la gravité, à la fin des années 1600, les sciences phénoménales et les plus 
hautes mathématiques étaient restées en étroite symbiose - au point qu'un formalisme mathématique 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


18/4839 







Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

prédictif était devenu le signe distinctif d'une "science dure". 

Après Newton, pendant les deux siècles qui suivirent, la science aspira à ce genre de rigueur et de 
pureté qui semblaient inhérentes aux mathématiques. La question métaphysique semblait simple: les 
mathématiques possédaient une connaissance a priori parfaite, et parmi les sciences, celles qui étaient 
capables de se mathématiser le plus parfaitement étaient les plus efficaces pour la prédiction des 
phénomènes. La connaissance parfaite consistait donc dans un formalisme mathématique qui, une fois 
atteint par la science et embrassant tous les aspects de la réalité, pouvait fonder une connaissance 
empirique a postériori sur une logique rationnelle a priori. Ce fut dans cet esprit que Marie 
Jean-Antoine Nicolas de Caritat, marquis de Condorcet (philosophe et mathématicien français), 
entreprit d'imaginer la description de l'Univers entier comme un ensemble d'équations différentielles 
partielles se résolvant les unes après les autres. 

La première faille dans cette image inspiratrice apparut dans la seconde moitié du 19ème siècle, quand 
Riemann et Lobatchevsky prouvèrent séparément que l'axiome des parallèles d'Euclide pouvait être 
remplacé par d'autres qui produisaient des géométries "consistantes" (nous reviendrons sur ce terme 
plus loin). La géométrie de Riemann prenait modèle sur une sphère, celle de Lobatchevsky, sur la 
rotation d'un hyperboloïde. 

L'impact de cette découverte a été obscurci plus tard par de grands chamboulements, mais sur le 
moment, elle fit un coup de tonnerre dans le monde intellectuel. L'existence de systèmes axiomatiques 
mutuellement inconsistants, et dont chacun pouvait servir de modèle à l'Univers phénoménal, remettait 
entièrement en question la relation entre les mathématiques et la théorie physique. 

Quand on ne connaissait qu'Euclide, il n'y avait qu'une géométrie possible. On pouvait croire que les 
axiomes d'Euclide constituaient un genre de connaissance parfaite a priori sur la géométrie dans le 
monde phénoménal. Mais soudain, nous avons eu trois géométries, embarrassantes pour les subtilités 
métaphysiques. 

Pourquoi aurions-nous à choisir entre les axiomes de la géométrie plane, sphérique et hyperbolique 
comme descriptions de la géométrie du réel? Parce que toutes les trois sont consistantes, nous ne 
pouvons en choisir aucune comme fondement a priori - le choix doit devenir empirique, basé sur leur 
pouvoir prédictif dans une situation donnée. 

Bien sûr, les théoriciens de la physique ont longtemps été habitués à choisir des formalismes pour poser 
un problème scientifique. Mais il était admis largement, si ce n'est inconsciemment, que la nécessité de 
procéder ainsi était fonction de l'ignorance humaine, et qu'avec de la logique ou des mathématiques 
assez bonnes, on pouvait déduire le bon choix à partir de principes premiers, et produire des 
descriptions a priori de la réalité, qui devaient être confirmées après coup par une vérification 
empirique. 

Cependant, la géométrie euclidienne, considérée pendant plusieurs centaines d'années comme le 
modèle de la perfection axiomatique des mathématiques, avait été détrônée. Si l'on ne pouvait connaître 
a priori quelque chose d'aussi fondamental que la géométrie dans l'espace, quel espoir restait-il pour une 
pure théorie rationnelle qui embrasserait la totalité de la nature ? Psychologiquement, Riemann et 
Lobatchevsky avaient frappé au coeur de l'entreprise mathématique telle qu'elle avait été conçue 
jusqu'alors. 

De plus, Riemann et Lobatchevsky remettaient la nature de l'intuition mathématique en question. Il 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


19/4839 






Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

avait été facile de croire implicitement que l'intuition mathématique était une forme de perception - une 
façon d'entrevoir le monde platonicien derrière la réalité. Mais avec deux autres géométries qui 
bousculaient celle d'Euclide, personne ne pouvait plus être sûr de savoir à quoi le monde ressemblait. 

Les mathématiciens répondirent à ce double problème avec un excès de rigueur, en essayant 
d'appliquer la méthode axiomatique à toutes les mathématiques. Dans la période pré-axiomatique, les 
preuves reposaient souvent sur des intuitions communément admises de la "réalité" mathématique, qui 
ne pouvaient plus être considérées automatiquement comme valides. 

La nouvelle façon de penser les mathématiques conduisait à une série de succès spectaculaires. 

Pourtant cela avait aussi un prix. La méthode axiomatique rendait la connexion entre les 
mathématiques et la réalité phénoménale toujours plus étroite. En même temps, des découvertes 
suggéraient que les axiomes mathématiques qui semblaient être consistants avec l'expérience 
phénoménale pouvaient entraîner de vertigineuses contradictions avec cette expérience. 

La majorité des mathématiciens devinrent rapidement des "formalistes", soutenant que les 
mathématiques pures ne pouvaient qu'être considérées philosophiquement comme une sorte de jeu 
élaboré qui se jouait avec des signes sur le papier (c'est la théorie qui sous-tend la prophétique 
qualification des mathématiques de "système à contenu nul" par Robert Heinlein). La croyance 
"platonicienne" en la réalité des objets mathématiques, à l'ancienne manière, semblait bonne pour la 
poubelle, malgré le fait que les mathématiciens continuaient à se sentir comme les platoniciens durant le 
processus de découverte des mathématiques. 

Philosophiquement, donc, la méthode axiomatique conduisait la plupart des mathématiciens à 
abandonner les croyances antérieures en la spécificité métaphysique des mathématiques. Elle produisit 
aussi la rupture contemporaine entre les mathématiques pures et appliquées. La plupart des grands 
mathématiciens du début de la période moderne - Newton, Leibniz, Lourier, Gauss et les autres - 
s'occupaient aussi de science phénoménale. La méthode axiomatique avait couvé l'idée moderne du 
mathématicien pur comme un super esthète, insoucieux de la physique. Ironiquement, le formalisme 
donnait aux purs mathématiciens un mauvais penchant à l'attitude platonicienne. Les chercheurs en 
mathématiques appliquées cessèrent de côtoyer les physiciens et apprirent à se mettre à leur traîne. 

Ceci nous emmène au début du 20ème siècle. Pour la minorité assiégée des platoniciens, le pire était 
encore à venir. Cantor, Frege, Russell et Whitehead montrèrent que toutes les mathématiques pures 
pouvaient être construites sur le simple fondement axiomatique de la théorie des ensembles. Cela 
convenait parfaitement aux formalistes: les mathématiques se réunifiaient, du moins en principe, à 
partir d'un faisceau de petits jeux détachés d'un grand. Les platoniciens aussi étaient satisfaits, s'il en 
survenait une grande structure, clé de voûte consistante pour toutes les mathématiques, la spécificité 
métaphysique des mathématiques pouvait encore être sauvée. 

D'une façon négative, pourtant, un platonicien eut le dernier mot. Kurt Gôdel mit son grain de sable 
dans le programme formaliste d'axiomatisation quand il démontra que tout système d'axiomes assez 
puissant pour inclure les entiers devait être soit inconsistant (contenir des contradictions) soit incomplet 
(trop faible pour décider de la justesse ou de la fausseté de certaines affirmations du système). Et c'est 
plus ou moins où en sont les choses aujourd'hui. Les mathématiciens savent que de nombreuses 
tentatives pour faire avancer les mathématiques comme une connaissance a priori de l'Univers doivent 
se heurter à de nombreux paradoxes et à l'impossibilité de décider quel système axiomatique décrit les 
mathématiques réelles. Ils ont été réduits à espérer que les axiomatisations standards ne soient pas 
inconsistantes mais incomplètes, et à se demander anxieusement quelles contradictions ou quels 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


20/4839 






Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

théorèmes indémontrables attendent d'être découverts ailleurs. 

Cependant, sur le front de l'empirisme, les mathématiques étaient toujours un succès spectaculaire en 
tant qu'outil de construction théorique. Les grands succès de la physique du 20ème siècle (la relativité 
générale et la physique quantique) poussaient si loin hors du royaume de l'intuition physique, qu'ils ne 
pouvaient être compris qu'en méditant profondément sur leurs formalismes mathématiques, et en 
prolongeant leurs conclusions logiques, même lorsque ces conclusions semblaient sauvagement 
bizarres. Quelle ironie! Au moment même où la perception mathématique en venait à paraître toujours 
moins fiable dans les mathématiques pures, elle devenait toujours plus indispensable dans les sciences 
phénoménales. 

À l'opposé de cet arrière-plan, l'applicabilité des mathématiques à la science phénoménale pose un 
problème plus épineux qu'il n'apparaît d'abord. Le rapport entre les modèles mathématiques et la 
prédiction des phénomènes est complexe, pas seulement dans la pratique mais dans le principe. 

D'autant plus complexe que, comme nous le savons maintenant, il y a des façons d'axiomatiser les 
mathématiques qui s'excluent! 

Mais pourquoi existe-t-il seulement de bons choix de modèle mathématique ? C'est à dire, pourquoi y 
a-t-il un formalisme mathématique, par exemple pour la physique quantique, si productif qu'il prédit 
réellement la découverte de nouvelles particules observables ? 

Pour répondre à cette question nous observerons qu'elle peut, aussi bien, fonctionner comme une sorte 
de définition. Pour beaucoup de systèmes phénoménaux, de tels formalismes prédictifs exacts n'ont pas 
été trouvés, et aucun ne semble plausible. Les poètes aiment marmonner sur le coeur des hommes, mais 
on peut trouver des exemples plus ordinaires: le climat, où le comportement d'une économie supérieure 
à celle d'un village, par exemple - systèmes si chaotiquement interdépendants que la prédiction exacte 
est effectivement impossible (pas seulement dans les faits mais en principe). 

LL PARADOXES 


Dès l'antiquité, certains logiciens avaient constaté la présence de nombreux paradoxes au sein de la 
rationalité. En fait, nous pouvons dire que malgré leur nombre, ces paradoxes ne sont que les 
illustrations d'un petit nombre de structures paradoxales. Attardons-nous à exposer à titre de culture 
générale les plus connus qui constituent la classe des "propositions indécidables". 

Exemples: 

El. Le paradoxe de la classe des classes (Russell) 

Il existe deux types de classes: celles qui se contiennent elles-mêmes (ou classes réflexives: la classe 
des ensembles non-vides, la classe des classes,...) et celles qui ne se contiennent pas elles-mêmes (ou 
classes irréflexives: la classe des travaux à rendre, la classe des oranges sanguines,...). La question 
posée est la suivante: la classe des classes irréflexives est-elle elle-même réflexive ou irréflexive? Si elle 
est réflexive, elle se contient et se trouve rangée dans la classe des classes irréflexives qu'elle constitue, 
ce qui est contradictoire. Si elle est irréflexive, elle doit figurer dans la classe des classes irréflexives 
qu'elle constitue et devient ipso facto réflexive, nous sommes face à une nouvelle contradiction. 

E2. Le paradoxe du bibliothécaire (Gonseth) 

Dans une bibliothèque, il existe deux types de catalogues. Ceux qui se mentionnent eux-mêmes et ceux 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


21/4839 








[SCIENCES.CH] 


qui ne se mentionnent pas. Un bibliothécaire doit dresser le catalogue de tous les catalogues qui ne se 
mentionnent pas eux-mêmes. Arrivé au terme de son travail, notre bibliothécaire se demande s'il 
convient ou non de mentionner le catalogue qu'il est précisément en train de rédiger. A ce moment, il 
est frappé de perplexité. S'il ne le mentionne pas, ce catalogue sera un catalogue qui ne se mentionne 
pas et qui devra dès lors figurer dans la liste des catalogues ne se mentionnant pas eux-mêmes. D'un 
autre côté, s'il le mentionne, ce catalogue deviendra un catalogue qui se mentionne et qui ne doit donc 
pas figurer dans ce catalogue, puisque celui-ci est le catalogue des catalogues qui ne se mentionnent 
pas. 

E3. Le paradoxe du menteur (variante) 

Définissons provisoirement le mensonge comme l'action de formuler une proposition fausse. Le poète 
crétois Epiménide affirme: "Tous les Crétois sont des menteurs", soit la proposition P. Comment 
décider de la valeur de vérité de P ? Si P est vraie, comme Epiménide est Crétois, P doit être fausse. Il 
faut donc que P soit fausse pour pouvoir être vraie, ce qui est contradictoire. P est donc fausse. 
Remarquons qu'on ne peut pas en déduire, comme dans le véritable paradoxe du menteur, que P doit 
aussi être vraie. 

2. RAISONNEMENT HYPOTHETICO-DEDUCTIF 

Le raisonnement hypothético-déductif est, nous le savons, la capacité qu'a l'apprenant de déduire des 
conclusions à partir de pures hypothèses et pas seulement d'une observation réelle. C'est un processus 
de réflexion qui tente de dégager une explication causale d'un phénomène quelconque (nous y 
reviendrons lors de nos premiers pas en physique). L'apprenant qui utilise ce type de raisonnement 
commence par formuler une hypothèse et essaie ensuite de confirmer ou d'infirmer son hypothèse selon 
le schéma synoptique ci-dessous: 




Processus de déduction 



Processus d observation s 
empiriques 


Modification des 
hypothèses 



Confirme... Ns confirme pas... 




Acceptation 

provisoire 


Rejet 

Figure: 1.1 - Diagramme synoptique du raisonnement hypothético-déductif 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


22/4839 
























Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

La procédure déductive consiste à tenir pour vrai, à titre provisoire, cette proposition première que 
nous appelons, en logique "le prédicat" (voir plus bas) et à en tirer toutes les conséquences logiquement 
nécessaires, c'est-à-dire à en rechercher les implications. 

Exemple: 

Soit la proposition P : "X est un homme", elle implique la proposition suivante Q : Xest mortel. 

L'expression P => Q (si c'est un homme il est nécessairement mortel) est un implication prédicative 
(d'où le terme "prédicat"). Il n'y a pas dans cet exemple de cas où nous puissions énoncer P sans Q. Cet 
exemple est celui d'une implication stricte, telle que nous la trouvons dans le "syllogisme" (figure 
logique du raisonnement). 



3. CALCUL PROPOSITIQNNEL 


Le "calcul propositionnel" (ou "logique propositionnelle") est un préliminaire absolument indispensable 
pour aborder une formation en sciences, philosophie, droit, politique, économie, etc. Ce type de calcul 
autorise des procédures de décisions ou tests. Ceux-ci permettent de déterminer dans quel cas une 
expression (proposition) logique est vraie et en particulier si elle est toujours vraie. 

Définitions: 

Dl. Une expression toujours vraie quel que soit le contenu linguistique des variables qui la composent 
est appelée une "expression valide", une "tautologie", ou encore une "loi de la logique 
propositionnelle". 

D2. Une expression toujours fausse est appelée une "contradiction" ou "antilogie". 

D3. Une expression qui est parfois vraie, parfois fausse est appelée une "expression contingente". 

D4. Nous appelons "assertion" une expression dont nous pouvons dire sans ambiguïté si elle est vraie 
ou fausse. 

D5. Le "langage objet" est le langage utilisé pour écrire les expressions logiques. 


D6. Le "métalangage" est le langage utilisé pour parler du langage objet dans la langue courante. 






















Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

3.1. PROPOSITIONS 


Définition: En logique, une "proposition" est une affirmation qui a un sens. Cela veut dire que nous 
pouvons dire sans ambiguïté si cette affirmation est vraie (F) ou fausse (F). C'est ce que nous appelons 
le "principe du tiers exclu". 

Exemple: 

"Je mens" n'est pas une proposition. Si nous supposons que cette affirmation est vraie, elle est une 
affirmation de sa propre invalidité, donc nous devrions conclure qu'elle est fausse. Mais si nous 
supposons qu'elle est fausse, alors l'auteur de cette affirmation ne ment pas, donc il dit la vérité, aussi la 
proposition serait vraie. 

Définition: Une proposition en logique binaire (où les propositions sont soit vraies, soit fausses) n'est 
donc jamais vraie et fausse à la fois. C'est que nous appelons le "principe de non-contradiction". 

Ainsi, une propriété sur l'ensemble E des propositions est une application P de E dans l'ensemble des 
"valeurs de vérité": 


P\ E-ï {F,F) (î.i) 

Nous parlons de "sous-ensemble associé", lorsque la proposition engendre uniquement une partie E’ de 
E et inversement. 


Exemple: 

Dans E = N, si P(x) s'énonce ”x est pair" , alors P = {0,2,4,..., 2k,...} ce qui est bien seulement un 
sous-ensemble associé de E mais de même cardinal (cf. chapitre Théorie Des Ensembles). 

Définition: Soit P une propriété sur l'ensemble E. Une propriété Q sur E est une "négation" de P si et 
seulement si, pour tout xe. E'- 

- Q(x) est F si P(x) est V 

- Q(x) est V si P(x) est F 


Nous pouvons rassembler ces conditions dans une table dite "table de vérité": 


P 

Q 

V 

F 

F 

V 


Tableau: 1.1- Table de vérité des valeurs 


Table que nous pouvons aussi trouver ou donc aussi écrire sous la forme plus explicite suivante: 


P 

Q 

Vrai 

Faux 

Faux 

Vrai 


Tableau: 1.2- Table de vérité des valeurs 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


24/4839 





















Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

ou encore sous forme binaire: 


P 

Q ~~| 

1 

0 

0 

î 


Tableau: 1.3 - Table de vérité des valeurs 


En d'autres termes, PetQ ont toujours des valeurs de vérité contraires. Nous noterons ce genre 
d'énoncé "Q est une négation de P": 


( 1 . 2 ) 

où le symbole -i est le "connecteur de négation". 

r ; 'n 

Remarque: Les expressions doivent être des expressions bien formées (souvent abrégé "ebf'). Par 
définition, toute variable est une expression bien formée, alors —p est une expression bien formée. 

Si P,Q sont des expressions bien formées, alors P=> Q est une expression bien formée (l'expression 
"je mens" n'est pas bien formée car elle se contredit elle-même). 

V___/ 

3.2. CONNECTEURS 


Il y a d'autres types de connecteurs en logique: 

Soient P et Q deux propriétés définies sur le même ensemble E. P V Q (lire "P ou Q ") est une propriété 
sur E définie par: 

- P V Q est vraie si au moins l'une des propriétés P Q est vraie 

- P V Q est fausse sinon 


Nous pouvons créer la table de vérité du "connecteur OU" ou "connecteur de disjonction" V : 


p 

q "~i 

PVQ 

V 

V 

V 

V 

F 

V 

F 

V 

V 

F 

F 

F 


Tableau: 1.4- Table de vérité de OU 


Il est facile de se convaincre que, si les parties P Q de E sont respectivement associées aux propriétés 

P, Q que P uQ (cf. chapitre Théorie Des Ensembles) est associé à P V Q. 

P^P 

Q^Q 

PVQ&PuQ 

Le connecteur V est associatif. Pour s'en convaincre, il suffit de faire une table de vérité où nous 

[Vincent ISOZ] | http://www.sciences.ch] | Page: 


25/4839 



























Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

vérifions que: 


[PV(QVR)]^[(PVQ)VR] (i.4) 


Il existe également le "connecteur ET" ou "connecteur de conjonction" A pour quel que soient 
P, Q deux propriétés définies sur E, P A Q est une propriété sur E définie par: 

- P A Q est vraie si toutes les deux propriétés P, Q sont vraies 

- P A Q est fausse sinon 

Nous pouvons créer la table de vérité du connecteur A : 


P 

Q 

PAQ 

V 

V 

V 

V 

F 

F 

F 

V 

F 

F 

F 

F 


Tableau: 1.5 - Table de vérité de ET 


Il est également facile de se convaincre que, si les parties P, Q de E sont respectivement associées aux 
propriétés P, Q que PnQ (cf. chapitre Théorie Des Ensembles) est associé à P A Q : 

P P 

Q<->Q 

PAQ O PnQ 

Le connecteur A est associatif. Pour s'en convaincre, il suffit aussi de faire une table de vérité où nous 
vérifions que: 


[PA(QAK)]&[(PAQ)AR] (i.6) 

Les connecteurs A, V sont distributifs l'un sur l'autre. A l'aide d'une simple table de vérité, nous 
prouvons que: 


ainsi que: 


[PV(eAi?)]^[(PV0AOPVR)] (1.7) 

[PA(gViî)]^[(RA0V(RAR)] (i.8) 


Une négation de P V Q est [ (~iP) A (—'Q)] une négation de P A Q est [ (—>jP) V (-ig)] tel que pour 
résumer: 


-(RV0«[(-F)A(-0] 


(1.9) 


A nouveau, ces propriétés peuvent se démontrer par une simple table de vérité. 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


26/4839 















Revenons maintenant sur le "connecteur d'implication logique" appelé aussi parfois le "conditionnel" 
noté "=>" 


Remarque: Dans certains ouvrages sur le calcul propositionnel, ce connecteur est noté " z> " et dans 
le cadre de la théorie de la démonstration nous lui préférons souvent le symbole " 

v_I_ ' 


Soient P, Q deux propriétés sur E. P => Q est une propriété sur E définie par: 


- P => Q est fausse si P est vraie et Q fausse 


- P => Q est vraie sinon 

En d'autres termes, P implique logiquement Q signifie que Q est vraie pour toute évaluation pour 
laquelle P est vraie. L'implication représente donc le "si... alors.." 

Si nous écrivons la table de vérité de l'implication (attention à l'avant-dernière ligne !!!): 


P 

Q 

P^Q 

V 

V 

V 

V 

F 

F 

F 

V 

V 

F 

F 

V 


Tableau: 1.6 - Table de vérité de l'implication 


Si P=>Q , nous pouvons dire que pour que Q soit vraie, il suffit que P soit vraie (effectivement 
l'implication sera vraie si P est vraie ou fausse selon la table de vérité). Donc P est une condition 
suffisante de Q (mais non nécessaire!). D'un autre côté, P => Q est équivalent à ~i Q => —>P . Donc, si 
Q est fausse, il est impossible que P soit vraie (pour que l'implication reste vraie bien sûr!). Donc 
finalement Q est une condition nécessaire de P. 

Exemples: 

El. Soit la proposition: "Si tu obtiens ton diplôme, je t'achète un ordinateur" 

Parmi tous les cas, un seul correspond à une promesse non tenue: celui où l'enfant à son diplôme, et n'a 
toujours pas d'ordinateur (deuxième ligne dans le tableau). 

Et le cas où il n'a pas le diplôme, mais reçoit quand même un ordinateur? Il est possible qu'il ait été 
longtemps malade et a raté un semestre, et le père a le droit d'être bon. 

Que signifie cette promesse, que nous écrirons aussi: "Tu as ton diplôme => je t'achète un ordinateur" ? 
Exactement ceci: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


27/4839 





























[SCIENCES.CH] 


- Si tu as ton diplôme, c'est sûr, je t'achète un ordinateur (je ne peux pas ne pas l'acheter) 

- Si tu n'as pas ton diplôme, je n'ai rien dit 

E2. De toute proposition fausse nous pouvons déduire toute proposition (deux dernières lignes) 

C'est un exemple plutôt anecdotique: dans un cours de Russell portant sur le fait que d'une proposition 
fausse, toute proposition peut être déduite, un étudiant lui posa la question suivante: 

- "Prétendez-vous que de 2 + 2 = 5, il s'ensuit que vous êtes le pape ? " 

- "Oui", fit Russell 

- "Et pourriez-vous le prouver !", demanda l'étudiant sceptique 

- "Certainement", réplique Russell, qui proposa sur le champ la démonstration suivante. 

(1) Supposons que 2 + 2 = 5 

(2) Soustrayons 2 de chaque membre de l'égalité, nous obtenons 2 = 3 

(3) Par symétrie, 3 = 2 

(4) Soustrayant 1 de chaque côté, il vient 2=1 

Maintenant le pape et moi sommes deux. Puisque 2 = 1, le pape et moi sommes un. Par suite, je suis le 
pape. 

Sur ce ... 

Le connecteur d'implication est essentiel en mathématiques, philosophie, etc. C'est un des fondements 
de toute démonstration, preuve ou déduction. 

Le connecteur d'implication a comme propriétés (vérifiables à l'aide de la table de vérité ci-dessous): 


P=>Q**Km=><r'P)] 

P=>Q&[^F)VQ] 


conséquence de la dernière propriété (à nouveau vérifiable par une table de vérité): 


-nfP=>e)O[/>A(^0] (1.11) 


Le "connecteur d'équivalence logique" ou "biconditionnel" noté " <=> " ou " ** " signifiant par définition 
que: 


{P&Q)&{P=ïQ)A{Q=>P) ( 1 . 12 ) 


en d'autres termes, la première expression a la même valeur pour toute évaluation de la deuxième. 
Ce que nous pouvons vérifier à l'aide d'une table de vérité: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 







Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


P 

Q 

P^Q 

Q=>P 

P&Q 

V 

V 

V 

V 

V 

V 

F 

F 

V 

F 

F 

V 

V 

F 

F 

F 

F 

V 

V 

V 


Tableau: 1.7 - Table de vérité de l'équivalence logique 


P <=> Q signifie bien (lorsqu'il est vrai!) que "P et Q ont toujours la même valeur de vérité" ou encore 
"P et Q sont équivalents". C'est vrai si P et Q ont même valeur, faux dans tout cas contraire. 

Bien évidemment (c'est une tautologie): 

-(P^0^(GF^(-0) (1.13) 

La relation P <=> Q équivaut donc à ce que P soit une condition nécessaire et suffisante de Q et à ce 
que Q soit une condition nécessaire et suffisante de P. 

La conclusion, est que les conditions de type "nécessaire, suffisant, nécessaire et suffisant" peuvent 
être reformulées avec les termes "seulement si", "si", "si et seulement si". 

A in si: 

1 . P => Q traduit le fait que Q est une condition nécessaire pour P ou dit autrement, P est vraie 
seulement si Q est vraie (dans la table de vérité, lorsque P=> Q prend la valeur 1 on constate bien que 
P vaut 1 seulement si Q vaut 1 aussi). On dit aussi, si P est vraie alors Q est vraie. 

2. P <= Q ou ce qui revient au même Q=> P traduit le fait que Q est une condition suffisante pour P 
ou dit autrement, P est vraie si Q est vraie (dans la table de vérité, lorsque Q=> P prend la valeur 1 on 
constate bien que P vaut 1 si Q vaut 1 aussi). 


3 . P <=>Q traduit le fait que Q est une condition nécessaire et suffisante pour P ou dit autrement, P est 
vraie si et seulement si Q est vraie (dans la table de vérité, lorsque P Q prend la valeur 1 on 
constate bien que P vaut 1 si Q vaut 1 et seulement si Q vaut 1). 



La première étape du calcul propositionnel est donc la formalisation des énoncés du langage naturel. 
Pour réaliser ce travail, le calcul propositionnel fournit finalement trois types d'outils : 

1. Les "variables propositionnelles" ( P , Q, R,...) symbolisent des propositions simples quelconques. Si la 
même variable apparaît plusieurs fois, elle symbolise chaque fois la même proposition. 

2. Les cinq opérateurs logiques: A. V,=>, w 

3. Les signes de ponctuation se réduisent aux seules parenthèses ouvrante et fermante qui organisent la 
lecture de manière à éviter toute ambiguïté. 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


29/4839 



























Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

Voici un tableau récapitulatif: 


Description 

Symbole 

Utilisation 

La "négation" est un opérateur qui ne porte que sur 
une proposition; il est unaire ou monadique. "Il ne 
pleut pas " s'écrit -i p. Cet énoncé est vrai si et 
seulement si P est faux (dans ce cas s'il est faux qu'il 
pleut). L'usage classique de la négation est caractérisé 
par la loi de double négation: - 1-1 p est équivalent à P. 

—1 

-i P 

La "conjonction" ou "produit logique" est un opérateur 
binaire; elle met en relation deux propositions. "Tout 
homme est mortel ET Ma voiture perd de l'huile " 
s'écrit {Pf\Q) . Cette dernière expression est vraie si 

et seulement si P est vrai et Q est vrai. 

A 

( [PAQ) 

La "disjonction" ou "somme logique" est, elle aussi, un 
opérateur binaire. (P V Q) ; est vraie si et seulement si 

P est vraie ou Q est vraie. Nous pouvons comprendre 
ce OU de deux façons : soit de manière inclusive, soit 
de manière exclusive. Dans le premier cas [P\f g) est 
vrai si P est vraie, si Q est vraie ou si P et Q sont tous 
deux vrais. Dans le second cas, (P V Q ) est vraie si P 

est vraie ou si Q est vraie mais pas si les deux le sont. 

La disjonction du calcul propositionnel est le OU 
inclusif et on donne au OU exclusif le nom 

"d'alternative". 

V 

P>VG) 

"L'implication" est également un opérateur 
binaire. Elle correspond, en gros, au schéma 
linguistique "Si...alors...". "Si j'ai le temps, j'irai au 
cinéma " s'écrit P=> Q. P=> Q est fausse si P est vrai 
et Q est faux. Si le conséquent (ici Q) est vrai, 
l'implication (P => Q ) est vraie. Lorsque l'antécédente 

(ici P) est fausse, l'implication est toujours vraie. Cette 
dernière remarque peut être comprise si l'on se réfère à 
des énoncés de type : "Si on pouvait mettre Paris en 
bouteille, on utiliserait la tour Eiffel comme 
bouchon ." En résumé, une implication est fausse si et 
seulement si son antécédente est vraie et son 
conséquent est fausse. 

=> 


La "bi-implication" est, elle aussi, binaire : elle 
symbolise les expressions "... si et seulement si..." et 
"... est équivalent à..." L'équivalence entre deux 
propositions est vraie si celles-ci ont la même valeur de 
vérité. La bi-implication exprime donc aussi une forme 

<=> 

{P^Q) 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


30/4839 




















Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


d'identité et c'est pourquoi elle est souvent utilisée 
dans les définitions. 

Tableau: 1.8 - Récapitulatif des opérateurs 


Il est possible d'établir des équivalences entre ces opérateurs. Nous avons déjà vu comment le 
biconditionnel pouvait se définir comme un produit de conditionnels réciproques, voyons maintenant 
d'autres équivalences: 


(p=>e)«-.(PA-'G) 

{P=>Q)**{-iPVQ) 

(P\/Q)^( r P^Q) 

{PAQ)**^{P=>^Q) 


(1.14) 


r~ - 

Remarque: Les opérateurs classiques f\, V, <=> peuvent donc être définis à l'aide de => grâce 
aux lois d'équivalence entre opérateurs. 

V___ 


J 


Sont à noter également les deux relations de De Morgan (cf. chapitre d'Algèbre de Boole) : 

(1.15) 


Elles permettent de transformer la disjonction en conjonction et vice-versa: 


(^VG)o-.(^A-'G) 

(PAe)^-c^v-e) 


(1.16) 


3.3. PROCÉDURES DE DÉCISION 


Nous avons introduit précédemment les éléments de base nous permettant d'opérer sur des expressions 
à partir de propriétés (variables propositionnelles) sans toutefois dire grand-chose quant à la 
manipulation de ces expressions. Alors, il convient maintenant de savoir qu'en calcul propositionnel il 
existe deux manières d'établir qu'une proposition est une loi de la logique propositionnelle. Nous 
pouvons soit: 

1. Employer des procédures non axiomatisées 

2. Recourir à des procédures axiomatiques et démonstratives 

c --ï 

Remarque: Dans de nombreux ouvrages ces procédures sont présentées avant même la structure du 
langage propositionnel. Nous avons choisi de faire le contraire pensant que l'approche serait plus 
aisée. 

V_/ 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


31/4839 






























Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

3.3.1. PROCÉDURES DE DÉCISIONS NON AXIOMATISÉES 

Plusieurs de ces méthodes existent mais nous nous limiterons ici à la plus simple et à la plus parlante 
d'entre elles, celle du calcul matriciel, souvent appelée aussi "méthodes des tables de vérité". 

La procédure de construction est comme nous l'avons vu précédemment assez simple. Effectivement, la 
valeur de vérité d'une expression complexe est fonction de la valeur vérité des énoncés plus simples qui 
la composent, et finalement fonction de la valeur de vérité des variables propositionnelles qui la 
composent. En envisageant toutes les combinaisons possibles des valeurs de vérité des variables 
propositionnelles, nous pouvons déterminer les valeurs de vérité de l'expression complexe. 

Les tables de vérité, comme nous l'avons vu, permettent donc de décider, à propos de toute proposition, 
si celle-ci est une tautologie (toujours vraie), une contradiction (toujours fausse) ou une expression 
contingente (parfois vraie, parfois fausse). 

Nous pouvons ainsi distinguer quatre façons de combiner les variables propositionnelles, les 
parenthèses et les connecteurs: 



Nom 

Description 

Exemple 

1 

Enoncé mal formé 

Non-sens. Ni vrai, ni faux 

{\IP)Q 

2 

Tautologie 

Enoncé toujours vrai 

p\j^p 

3 

Contradiction 

Enoncé toujours faux 

(EA-.E) 

4 

Enoncé contingent 

Enoncé parfois vrai, parfois faux 

(^ve) 


Tableau: 1.9 - Combinaison de variables propositionnelles 


La méthode des tables de vérité permet de déterminer le type d'expression bien formée face auquel 
nous nous trouvons. Elle n'exige en principe aucune invention, c'est une procédure mécanique. Les 
procédures axiomatisées, en revanche, ne sont pas entièrement mécaniques. Inventer une 
démonstration dans le cadre d'un système axiomatisé demande parfois de l'habilité, de l'habitude ou de 
la chance. Pour ce qui est des tables de vérité, voici la marche à suivre: 

Lorsqu'on se trouve face à une expression bien formée, ou fonction de vérité, nous commençons par 
déterminer à combien de variables propositionnelles distinctes nous avons affaire. Ensuite, nous 
examinons les différents arguments qui constituent cette expression. Nous construisons alors un tableau 
comprenant 2 ” rangées (n étant le nombre de variables) et un nombre de colonnes égal au nombre 
d'arguments plus des colonnes pour l'expression elle-même et ses autres composantes. Nous attribuons 
alors aux variables les différentes combinaisons de vérité et de fausseté qui peuvent leur être conférées 
(la vérité est exprimée dans la table par un 1 et la fausseté par un 0). Chacune des rangées correspond à 
un monde possible et la totalité des rangées constitue l'ensemble des mondes possibles. Il existe, par 
exemple, un monde possible dans lequel P est une proposition vraie tandis que Q est fausse. 

3.3.2. PROCÉDURES DE DÉCISIONS AXIOMATISÉES 

L'axiomatisation d'une théorie implique, outre la formalisation de celle-ci, que nous partions d'un 
nombre fini d'axiomes et que, grâce à la transformation réglée de ces derniers, nous puissions obtenir 
tous les théorèmes de cette théorie. Nous partons donc de quelques axiomes dont la vérité est posée (et 
non démontrée). Nous déterminons des règles de déduction permettant de manipuler les axiomes ou 
toute expression obtenue à partir de ceux-ci. L'enchaînement de ces déductions est une démonstration 

[Vincent ISOZ] | http://www.sciences.ch] | Page: 


32/4839 























Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

qui conduit à un théorème, à une loi. 

Nous allons sommairement présenter deux systèmes axiomatiques, chacun étant constitué d'axiomes 
utilisant deux règles dites "règles d'inférence" (règles intuitives) particulières: 

Règle 1. Le "modus ponens": si nous avons prouvé A et A => B , alors nous pouvons déduire B. A est 
appelé la "prémisse mineure" et A => B la prémisse majeure de la règle du modus ponens. 

B Exemple: De x > y et (x > y) => (y < x) nous pouvons déduire y ^ x 

Règle 2. La "substitution": nous pouvons dans un schéma d'axiomes remplacer une lettre par une 
formule quelconque, pourvu que toutes les lettres identiques soient remplacées par des formules 
identiques. 

Donnons à titre d'exemple, deux systèmes axiomatiques: le système axiomatique de Whitehead et 
Russell, le système axiomatique de Lukasiewicz. 

1 . Le système axiomatique de Whitehead et Russel adopte comme symboles primitifs V et définit 
=>, à partir de ces derniers de la manière suivante (relations facilement vérifiables à l'aide de 
tables de vérité): 


(j4 => 5) <=> —iA\f B 

(. Af\B ) V —'B) 

(A&B)& ( j 4=> 5) A(B=>A) 


(1.17) 


nous avions déjà présenté plus haut quelques-uns de ces éléments. 

Ce système comprend cinq axiomes, assez évidents en soi plus les deux règles d'inférence. Les axiomes 
sont donnés ici en utilisant des symboles non primitifs, comme le faisaient Whitehead et Russel: 

Al. 

A2. B^{A\JB) 

A3. {A\jB)^{B\iA) 

A4. [A\i{B\iC))^ [B\j{A\iC)) 

A5. (B => C) => ((JV5) => (JVC)) 


Remarque: Ces cinq axiomes ne sont pas indépendants les uns des autres. Le quatrième peut être 
obtenu à partir des quatre autres. 




Exemple: 

Pour prouver -,A V A , nous pouvons procéder ainsi: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


33/4839 















[SCIENCES.CH] 


(1) 

( 2 ) 

(3) 

(4) 

(5) 


B => {AMB) 
A=ï{ÂMA) 


Axiome À2 
(1) et subst. 

Axiome A5 (nécessaire) 
(3) et subst. 

(4) et définition de => 

(5) et subst. 

(6) (modus ponens) 
(2) et (7) et axi orne Al 
(8) modus ponens 


{^B => C) => A V B'j => 'A VC')) 
(B => C) => ((^ => B) => (.4 => C)) 


( 6 ) 

(7) 

( 8 ) 

(9) 

( 10 ) 


{{AM A) => A) => ((^ => (A V J)) => {A => ,4)) 
(j4 => (j4 V j4)) => (j4 => 21) 

(j4=> ,4)=> (,4=> 4) 


,4 =>,4 
-<AVA 


(9) et déf. de => 


( 1 . 18 ) 


2. Le système axiomatique de Lukasiewicz comprend les trois axiomes suivants, plus les deux règles 
d'inférences (modus ponens et substitution): 


Al. (.4 =>£)=> ((£=> C)=> ( j 4 => C)) 

A2. A => A => B'j 
A3. (-ij4 => j4) => j4 

Voici des preuves des deux premiers axiomes, dans le système de Whitehead et Russel. Ce sont les 
formules (6) et (16) de la dérivation suivante: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 







Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


(1) 

(j4V(5VC0) 

=>{3y{AVC)) 

Axiome A4 

(2) 

(-^(B^c)W{->{AWB)y(Ayc))) 

=>(-.( J 4VB)V(-'C5=>C)VC J 4VC'))) 

(1) et subst. 

(3) 

-.(J MB) V (-i(£ => c) VU VC)) 

A4 sur (2) et modus ponens 

(4) 

( J 4V5)=>((5=>C)=>( J 4VC')) 

(3) par déf. de => 

(5) 

V-5) => ((5 => C) => (~id V C)) 

(4) et subst. 

(6) 

(J =>£)=> ((5 => C)=> (,4=> C)) 

(5) et déf. de => 

(7) 

(.5 => (^V^))=> 

r ((A\fB)=>(BVA))' 

^(B^(BWA)) 

(6) et subst. 

(S) 

{(A y B) => (BVA))=Ï [B => (B WA)) 

(7) modus ponens 

(9) 

B=> (B \f A) 

(8) modus ponens 

(10) 

(->B\/A) 

(9) et subst. 

CH) 

-i-iB\f(~tB\f A) 

(10) et déf. de => 

(12) 

( r ^B\/(^B\fÂ)) 

1 =*[-iBW(-n->B\/A)) 

Axiome A4 + subst. avec (11) 

(13) 

->BV{ 

-i-iBW A) 

(12) modus ponens 

(14) 


-i~iB\f A) 

(13) et déf. de => 

(15) 


(14) et déf. de => 

(16) 

A^(^A^B) 

(16) et subst. 


(1.19) 


Ces axiomatisations permettent de retrouver comme théorèmes toutes les tautologies ou lois de la 
logique propositionnelle. De par tout ce qui a été dit jusqu'à maintenant, nous pouvons tenter de définir 
ce qu'est une preuve. 

Définition: Une suite finie de formules B l ,B- 1 ,...,B m est appelée "preuve" à partir des hypothèses 
A i ,A 2 ,...,A s si pour chaque i: 

- Z?; est l'une des hypothèses A i ,A î ,...,A x 

- ou B i est une variante d'un axiome 

- ou B i est inférée (par application de la règle du modus ponens) à partir de la prémisse majeure B,- et 
de la prémisse mineure B k où j,k < i 

- ou B i est inférée (par application de la règle de substitution) à partir d'une prémisse antérieure Bj , la 
variable remplacée n'apparaissant pas dans A i ,A 1 ,...,A s 

Une telle suite de formules, B M étant la formule finale de la suite, est appelée plus explicitement 
"preuve de B m " à partir des hypothèses A l , A±A *, ce que nous notons par: 

4,V..,4,h B * ( L2 °) 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


35/4839 









3.4. QUANTIFICATEURS 

Nous devons compléter l'utilisation des connecteurs du calcul propositionnel par ce que nous appelons 
des "quantificateurs" si nous souhaitons pouvoir résoudre certains problèmes. Effectivement, le calcul 
propositionnel ne nous permet pas d'affirmer des choses générales sur les éléments d'un ensemble par 
exemple. Dans ce sens, la logique propositionnelle ne reflète qu'une partie du raisonnement. Le "calcul 
des prédicats" au contraire permet de manipuler formellement des affirmations telles que "il existe un x 
tel que [x a une voiture américaine]" ou "pour tous les x [si x est un teckel, alors x est petit]"; en 
somme, nous étendons les formules composées afin de pouvoir affirmer des quantifications 
existentielles ("il existe...") et des quantifications universelles ("pour tout...."). Les exemples que nous 
venons de donner font intervenir des propositions un peu particulières comme "x a une voiture 
américaine". Il s'agit ici de propositions comportant une variable. Ces propositions sont en fait 
l'application d'une fonction àx. Cette fonction, c'est celle qui associe "x a une voiture américaine" àx. 
Nous dénoterons cette fonction par "... a une voiture américaine" et nous dirons que c'est une fonction 
propositionnelle, car c'est une fonction dont la valeur est une proposition. Ou encore un "prédicat". 

Les quantificateurs existentiels et universels vont donc de pair avec l'emploi de fonctions 
propositionnelles. Le calcul des prédicats est cependant limité dans les formules existentielles et 
universelles. Ainsi, nous nous interdisons des formules comme "il existe une affirmation de x telle 
que...". En fait, nous ne nous autorisons à quantifier que des "individus". C'est pour cela que la logique 
des prédicats est dite une "logique du premier ordre". 

Avant de passer à l'étude du calcul des prédicats nous devons définir: 

Dl. Le "quantificateur universel": V (pour tout) 

D2. Le "quantificateur existentiel": 3 (il existe) 

r -:-^ 

Remarque: Nous utilisons parfois le symbole 3! pour dire brièvement: "il existe un et un seul": 

Vx e IR,3!.y e IR*, x = ln(y) (1.21) 

Nous allons voir que la théorie de la démonstration et des ensembles est l'exacte transcription des 
principes et résultats de la Logique (celle avec un "L" majuscule). 

s»_ ) 

4. CALCUL DES PRÉDICATS 


Dans un cours de mathématiques (d'algèbre, d'analyse, de géométrie,...), nous démontrons les 
propriétés de différents types d'objets (entiers, réels, matrices, suites, fonctions continues, courbes,...). 
Pour pouvoir prouver ces propriétés, il faut bien sûr que les objets sur lesquels nous travaillons soient 
clairement définis (qu'est-ce qu'un entier, un réel,...?). 

En logique du premier ordre et, en particulier, en théorie de la démonstration, les objets que nous 
étudions sont les formules et leurs démonstrations. Il faut donc donner une définition précise de ce que 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


36/4839 



















Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

sont ces notions. Les termes et les formules forment la grammaire d'une langue, simplifiée à l'extrême et 
calculée exactement pour dire ce que nous voulons sans ambiguïté et sans détour inutile. 

4.1. GRAMMAIRE 


Définitions: 

Dl. Les "termes", désignent les objets dont nous voulons prouver des propriétés (nous reviendrons un 
peu plus loin beaucoup plus en détail sur ces derniers): 

- En algèbre, les termes désignent les éléments d'un groupe (ou anneau, corps, espace vectoriel, etc.). 
Nous manipulons aussi des ensembles d'objets (sous-groupe, sous-espace vectoriel, etc). Les termes qui 
désignent ces objets, d'un autre type, seront appelés "termes du second ordre". 

- En analyse, les termes désignent les réels ou (par exemple, si nous nous plaçons dans des espaces 
fonctionnels) des fonctions. 

D2. Les "formules", représentent les propriétés des objets que nous étudions (nous reviendrons 
également beaucoup plus en détail sur ces dernières): 

- En algèbre, nous pourrons écrire des formules pour exprimer que deux éléments commutent, qu'un 
sous-espace vectoriel est de dimension 3, etc. 

- En analyse, nous écrirons des formules pour exprimer la continuité d'une fonction, la convergence 
d'une suite, etc. 

- En théorie des ensembles, les formules pourront exprimer l'inclusion de deux ensembles, 
l'appartenance d'un élément à un ensemble,... 

D3. Les "démonstrations", elles permettent d'établir qu'une formule est vraie. Le sens précis de ce mot 
aura lui aussi besoin d'être défini. Plus exactement, elles sont des déductions sous hypothèses, elles 
permettent de "mener du vrai au vrai", la question de la vérité de la conclusion étant alors renvoyée à 
celle des hypothèses, laquelle ne regarde pas la logique mais repose sur la connaissance que nous avons 
des choses dont nous parlons. 

4,2. LANGAGES 


En mathématique, nous utilisons, suivant le domaine, différents langages qui se distinguent par les 
symboles utilisés. La définition ci-dessous exprime simplement qu'il suffit de donner la liste de ces 
symboles pour préciser le langage. 

Définition: Un "langage" est la donnée d'une famille (pas nécessairement finie) de symboles. Nous en 
distinguons de trois sortes: symboles, termes et formules. 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


37/4839 









4.2.1. SYMBOLES 

Il existe différents types de symboles que nous allons tâcher de définir: 

Dl. Les "symboles de constante" (voir remarque plus bas) 

Exemple: 

Le n pour l'élément neutre en théorie des ensembles (cf. chapitre de Théorie Des Ensembles) 

D2. Les "symboles de fonction" ou "foncteurs". A chaque symbole de fonction est associé un entier 
strictement positif que nous appelons son "arité": c'est le nombre d'arguments de la fonction. Si l'arité 
est 1 (resp. 2,...,«), nous disons que la fonction est unaire (resp. binaire,..., «-aire) 


Exemple: 

Le foncteur binaire de multiplication * dans les groupes (cf. chapitre de Théorie Des Ensembles). 

D3. Les "symboles de relation". De la même manière, à chaque symbole de relation est associé un 
entier positif ou nul (son arité) qui correspond à son nombre d'arguments et nous parlons de relation 
unaire, binaire, «-aire (comme par exemple le symbole de relation "="). 

D4. Les "variables individuelles". Dans toute la suite, nous nous donnerons un ensemble infini V de 
variables. Les variables seront notées comme il l'est de tradition: x, y, z (éventuellement indexées: 

)• 

D5. A cela il faut rajouter les connecteurs et quantificateurs que nous avons longuement présentés plus 
haut et sur lesquels il est pour l'instant inutile de revenir. 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


38/4839 













4.2.2. TERMES 

Les termes (nous disons aussi "termes du premier ordre") représentent les objets associés au langage. 

Définitions: 

Soit £ un langage: 

Dl. L'ensemble J des termes sur £ est le plus petit ensemble contenant les variables, les constantes et 
stable (on ne sort pas de l'ensemble) par l'application des symboles de fonction de £ à des termes. 

D2. Un "terme clos" est un terme qui ne contient pas de variables (donc par extension, seulement des 
constantes). 

D3. Pour obtenir une définition plus formelle, nous pouvons écrire: 

T o = {£} (1.22) 

où t est une variable ou un symbole de constante et, pour tout k e N : 

2jt+i = ^ (1-23) 

où/est une fonction d'arité n (rappelons que l'arité est le nombre d'arguments de la fonction). Ainsi, 
pour chaque arité, il y a un degré d'ensemble de termes. Nous avons finalement: 

^ = U (1.24) 

jteN 

D4. Nous appellerons "hauteur" d'un terme t le plus petit k tel que ieî t . 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


39/4839 














Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

Remarques: 

RI. La définition D4 signifie que les variables et les constantes sont des termes et que si/est un 
symbole de fonction n-aire et sont des termes alors est un terme en soi aussi. 

L'ensemble J des termes est défini par la grammaire: 




(1.25) 


Cette expression se lit de la manière suivante: un élément de l'ensemble J que nous sommes en 
train de définir est soit un élément de V (variables), soit un élément de S c (l'ensemble des symboles 

de constantes), soit l'application d'un symbole de fonction / e S F à n éléments (constantes ou 
variables) de J. 


Attention: le fait que / soit de la bonne arité est seulement implicite dans cette notation. De plus, 
l'écriture X) ne signifie pas que tous les arguments d'une fonction sont identiques mais 

simplement que ces arguments sont des éléments de J. 


R2. Il est souvent commode de voir un terme (expression) comme un arbre dont chaque noeud est 
étiqueté par un symbole de fonction (opérateur ou fonction) et chaque feuille par une variable ou 
une constante. 

V_ J 


Dans la suite, nous allons sans cesse définir des notions (ou prouver des résultats) "par récurrence" sur 
la structure ou la taille d'un terme. 


Définitions: 

DI. Pour prouver une propriété P sur les termes, il suffit de prouver R pour les variables et les 
constantes et de prouver P(f (t Y ,...,t x )) à partir de P {4 ). Nous faisons ainsi ici une "preuve 

par induction sur la hauteur d'un terme". C'est une technique que nous retrouverons dans les chapitres 
suivants. 

D2. Pour définir une fonction sur les termes, il suffit de la définir sur les variables et les constantes 
et de dire comment nous obtenons à partir de . Nous faisons ici encore 

une "définition par induction sur la hauteur d'un terme". 

Exemple: 

La taille (nous disons aussi la "longueur") d'un terme t (notée T(t) ) est le nombre de symboles de 
fonction apparaissant dans t. Formellement: 

- t(x) = t(c) = 0 si x est une variable et c est une constante 

1Î2ÎJ! 


où le 1 dans la dernière relation relation représente le terme/. 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


40/4839 
















4.2.3. FORMULES 

Les formules sont construites à partir de "formules atomiques" en utilisant des connecteurs et des 
quantificateurs. Nous utiliserons les connecteurs et les quantificateurs suivants (qui nous sont déjà 
connus): 

- connecteur unaire de négation: -i 

- connecteurs binaires de conjonction et disjonction ainsi que d'implication: A , V , —> 

- quantificateurs: 3 qui se lit "il existe" et V qui se lit "pour tout" 

Cette notation des connecteurs est standard (elle devrait du moins). Elle est utilisée pour éviter les 
confusions entre les formules et le langage courant (le métalangage). 

Définitions: 


DI. Soit £ un langage, les "formules atomiques" de £ sont les formules de la forme R{t ^,) où R 
est un symbole de relation n-aire de £ et sont des termes de £. Nous notons "Atom" 

l'ensemble des formules atomiques. Si nous notons l'ensemble des symboles de relation, nous 
pouvons écrire l'ensemble des termes mis en relations par l'expression: 


Mom = S £ ÇT,...,T) 


(1.26) 


L'ensemble F des formules de la logique du premier ordre de £ est donc défini par la grammaire (où x 
est une variable): 


F = Mom \F\iF\F i\F\F -> f | F~F \ 3xF | VxF 


(1.27) 


où il faut lire: l'ensemble des formules est le plus petit ensemble contenant les formules et tel que si F 1 
et F 2 sont des formules alors F 1 V F 2 , etc. sont des formules et qu'elles peuvent être en relation entre 
elles. 


Exemple: 


Les symboles de relation du langage propositionnel sont des relations d'arité 0 (même le symbole "=" 
est absent), les quantificateurs sont alors inutiles (puisqu'une formule propositionnelle ne peut pas 
contenir des variables). Nous obtenons alors le calcul propositionnel défini par: 


Cj, Vp |1| —<Cp | Cp V Cp \ Cp j\Cp\Cp Cp 


(1.28) 


Remarquons la présence du symbole "bottom" signifiant le "faux" que nous n'avions pas mentionné lors 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


41/4839 















Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

de notre étude de la logique propositionnelle. 

Nous ferons attention à ne pas confondre termes et formules. sin(x) est un terme (fonction), x = 3 est 
une formule. Mais sin(x) /\(x = 3) n'est rien: nous ne pouvons, en effet, mettre un connecteur entre un 
terme et une formule (aucun sens). 

-\ 

Remarques: 

RI. Pour définir une fonction 0 sur les formules, il suffit de définir 0 sur les formules atomiques. 

R2. Pour prouver une propriété P sur les formules, il suffit de prouver P pour les formules 
atomiques. 

R3. Pour prouver une propriété P sur les formules, il suffit de supposer la propriété vraie pour 
toutes les formules de taille P < « et de la démontrer pour les formules de taille n. 

_ ) 

D2. Une "sous-formule" d'une formule (ou expression) F est l'un de ses composants, in extenso une 
formule à partir de laquelle F est construite. Formellement, nous définissons l'ensemble SF(F) des 
sous-formules de F par: 

- Si F est atomique: SF(F") = [F] 

- Si F = F x © F 2 (soit une composition!) avec® e {A, V,— >},SF(F) = {F} u SF(F 1 ) u SF(F 2 ) 

- Si F = ou QxF 1 avec Q e (V, ^ ,SF{F) = {F} u SF(F{) 

D3. Une formule F de £ n'utilise qu'un nombre fini de symboles de £. Ce sous-ensemble est appelé le 
"langage de la formule" et noté C(F). 

D4. La "taille (ou la longueur) d'une formule" F (notée t(F") ) est le nombre de connecteurs ou de 
quantificateurs apparaissant dans F. Formellement: 

- t(F) = 0 si F est une formule atomique 

-t(F 1 ®F 2 )= 1 + r(F l ) + t{F 2 ) où ©e{V,A> 

- iX.-'F)) = riQxF^) = 1 + TfFj) avec Q e (V, 3} 

D5. "L'opérateur principal" (nous disons aussi le "connecteur principal") d'une formule est défini par: 

- Si A est atomique, alors elle n'a pas d'opérateur principal 

- Si A = -iB, alors -i est l'opérateur principal de A 

-Si A = B®C où © e {/\ V, — 7 *}, alors © est l'opérateur principal de A 

- Si A = QxB où Q e (V, 3}, alors Q est l'opérateur principal de A 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


42/4839 












Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

D6. Soit F une formule. L'ensemble VL{F) des variables libres de F et l'ensemble VM(F) des 
variables muettes (ou liées) de F sont définis par récurrence sur t(F) . 

Une occurrence d'une variable donnée est dite "variable liée" ou "variable muette" dans une formule F 
si dans cette même formule, un quantificateur y fait référence. Dans le cas contraire, nous disons avoir 
une "variable libre". 

( -\ 

Remarque: Une occurrence d'une variable x dans une formule F est une position de cette variable 

dans la formule F. Ne pas confondre avec l'objet qu'est la variable elle-même. 

V___/ 

Pour préciser les variables libres possibles d'une formule F, nous noterons F[ Xj,..., x M ]. Cela signifie 
que les variables libres de F sont parmi x 1 ,..., x s in extenso si y est libre dans F, alors y est l'un des y 
mais les y n'apparaissent pas nécessairement dans F. 

Nous pouvons définir les variables muettes ou libres de manière plus formelle: 

1. Si F = est atomique alors VL(F) est l'ensemble des variables libres apparaissant dans les 

fj et nous avons alors pour les variables muettes VM (F) = 0 

2. Si F = F 1 © F 2 où ® e (A V,^} : VL(F) = VL{F ï )uVL(F 2 ) alors VM(F) = VM (A) u VM(F 2 ) 

3. si F = -iFj. alors VL(F) = VLiF^ et VM(F) = VM{F l ) 

4. si F = QxF } L avec Q e {V, 3} : VL{F) = VL{F l )~ {*} et VM(F) = VM (A) u {x} 

Exemples: 

El. Soit F: V* (x'y =yx) alors VL(F) = {y} et VM(F) ={*} 

E2. Soit G: (x ■ z = z ■ y)} A{ x = z ■ z) alors VL(G) ={x,z) et VM(G) = {x,y} 

D7. Nous disons que les formules F et G sont " a -équivalentes" si elles sont (syntaxiquement) 
identiques à un renommage près des occurrences liées des variables. 

D8. Une "formule close" est une formule sans variables libres. 

D9. Soit F une formule, x une variable et t un terme. F[x\ = t] est la formule obtenue en remplaçant 
dans F toutes les occurrences libres de x par t, après renommage éventuel des occurrences liées de F 
qui apparaissent libres dans t. 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


43/4839 














[SCIENCES.CH] 


r 




Remarques: 


RL Nous noterons dans les exemples vus qu'une variable peut avoir à la fois des occurrences libres 
et des occurrences liées. Nous n’avons donc pas toujours VL(F) nVM(F) = 0 

R2. Nous ne pouvons pas renommer y en x dans la formule Vy(x ■ y = y x) et obtenir la formule 
Vx(x • x = x • x) : la variable x serait "capturée". Nous ne pouvons donc pas renommer des variables 
liées sans précautions: il faut éviter de capturer des occurrences libres. 


J 


N. 


5. DÉMONSTRATIONS 

Les démonstrations que l'on trouve dans les ouvrages de mathématiques sont des assemblages de 
symboles mathématiques et de phrases contenant des mots-clés tels que: "donc", "parce que", "si", "si 
et seulement si", "il est nécessaire que", "il suffit de", "prenons un x tel que", "supposons que", 
"cherchons une contradiction", etc. Ces mots sont supposés être compris par tous de la même manière, 
ce qui n'est en fait, pas toujours le cas. 

Dans tout ouvrage, le but d'une démonstration est de convaincre le lecteur de la vérité de l'énoncé. 
Suivant le niveau du lecteur, cette démonstration sera plus ou moins détaillée: quelque chose qui pourra 
être considéré comme évident dans un cours de licence pourrait ne pas l'être dans un cours de niveau 
inférieur. 

Dans un devoir, le correcteur sait que le résultat demandé à l'étudiant est vrai et il en connaît la 
démonstration. L'étudiant doit démontrer (correctement) le résultat demandé. Le niveau de détail qu'il 
doit donner dépend donc de la confiance qu'aura le correcteur: dans une bonne copie, une "preuve par 
une récurrence évidente" passera bien, alors que dans une copie où il y eu auparavant un "évident", qui 
était évidemment... faux, ça ne passera pas! 

Pour pouvoir gérer convenablement le niveau de détail, il faut savoir ce qu'est une démonstration 
complète. Ce travail de formalisation n'a été fait qu'au début de 20ème siècle! ! 

Plusieurs choses peuvent paraître surprenantes: 

- il n'y a qu'un nombre fini de règles: deux pour chacun des connecteurs (et l'égalité) plus trois règles 
générales. Il n'était pas du tout évident a piori qu'un nombre fini de règles soit suffisant pour démontrer 
tout ce qui est vrai. Nous montrerons ce résultat (c'est essentiellement, le théorème de complétude). La 
preuve n'en est pas du tout triviale. 

- ce sont les mêmes règles pour toutes les mathématiques et la physique: algèbre, analyse, géométrie, 
etc. Cela veut dire que nous avons réussi à isoler tout ce qui est général dans un raisonnement. Nous 
verrons plus loin qu'une démonstration est un assemblage de couples, où r est un ensemble de 
formules (les hypothèses) et A une formule (la conclusion). Quand nous faisons de l'arithmétique, de la 
géométrie ou de l'analyse réelle, nous utilisons, en plus des règles, des hypothèses que l'on appelle des 
"axiomes". Ceux-ci expriment les propriétés particulières des objets que nous manipulons (pour plus de 
détails sur les axiomes voir la page d'introduction du site). 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


44/4839 















Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

Nous démontrons donc, en général, des formules en utilisant un ensemble d'hypothèses, et cet ensemble 
peut varier au cours de la démonstration: quand nous disons "supposons F et montrons G", F est alors 
une nouvelle hypothèse que nous pourrons utiliser pour montrer G. Pour formaliser cela, nous 
introduisons le concept de "séquent": 

Définitions: 

Dl. Un "séquent" est un couple (noté r \~F ) où: 

- T est un ensemble fini de formules qui représente les hypothèses que nous pouvons utiliser. Cet 
ensemble s'appelle aussi le "contexte du séquent". 

- F est une formule. C'est la formule que nous voulons montrer. Nous dirons que cette formule est la 
"conclusion du séquent". 

- N 

Remarques: 

RI. Si T = (j 4 1; ..., \} nous pourrons noter ^,...,\ h F au lieu de r \-F ■ Le signe 1- se lit "thèse" 
ou "démontre". 

R2. Nous noterons (- F un séquent dont l'ensemble d'hypothèses est vide et 1^,..., U, h F un 
séquent dont l'ensemble d'hypothèses est U ^ • 

Z 

R3. Nous noterons que dans le séquent Y, A h B la formule A peut être dans r (elle devient alors 
une hypothèse). 

R4. Nous écrirons r Y- F pour dire que " r \-F est non prouvable". 

_ / 

D2. Un séquent Y h F est "prouvable" (ou démontrable, dérivable) s'il peut être obtenu par une 
application finie de règles. Une formule F est prouvable si le séquent 1- F est prouvable. 

5.1. RÈGLES DE DÉMONSTRATION 

Les règles de démonstration sont les briques qui permettent de construire les dérivations. Une 
dérivation formelle est un assemblage fini (et correct!) de règles. Cet assemblage n'est pas linéaire (ce 
n'est pas une suite) mais un "arbre". Nous sommes en effet souvent amenés à faire des branchements. 

Nous allons présenter un choix de règles. Nous aurions pu en présenter d'autres (à la place ou en plus) 
qui donneraient la même notion de prouvabilité. Celles que l'on a choisies sont "naturelles" et 
correspondent aux raisonnements que l'on fait habituellement en mathématique. Dans la pratique 
courante nous utilisons, en plus des règles ci-dessous, beaucoup d'autres règles mais celles-ci peuvent se 
déduire des précédentes. Nous les appellerons "règles dérivées". 

Il est de tradition d'écrire la racine de l'arbre (le séquent conclusion) en bas, les feuilles en haut: la 
nature est ainsi faite... Comme il est également de tradition d'écrire, sur une feuille de papier, de haut en 
bas, il ne serait pas déraisonnable d'écrire la racine en haut et les feuilles en bas. Il faut faire un choix ! 

Une règle se compose: 

[Vincent ISOZ] | http://www.sciences.ch] | Page: 


45/4839 












Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

- d'un ensemble de "prémisses": chacune d'elles est un séquent. Il peut y en avoir zéro, un ou plusieurs 

- du séquent conclusion de la règle 

- d'une barre horizontale séparant les prémisses (en haut) de la conclusion (en bas). Sur la droit de la 
barre, nous indiquerons le nom de la règle. 

Exemple: 


t\-a 

Ÿ~hB 




(1.29) 


Cette règle a deux prémisses ( r h 21 —> i? et r h 21 ) et une conclusion ( T h B ) et se note de manière 
abrégée sous la forme: —. Elle peut se lire de deux manières: 


- de bas en haut: si nous voulons prouver la conclusion, il suffit par utilisation de la règle de prouver les 
prémisses. C'est ce qu'on fait quand nous cherchons une démonstration. Cela correspond à "l'analyse". 

- de haut en bas: si nous avons prouvé les prémisses, alors nous avons aussi prouvé la conclusion. C'est 
ce que nous faisons quand nous rédigeons une démonstration. Cela correspond à la "synthèse". 

Pour les démonstrations il existe un nombre fini de règles au nombre de 17 que nous allons définir 
ci-après: 

1. Axiome: 


- ax 

r ,a\-a 


(1.30) 


De bas en haut: si la conclusion du séquent est une des hypothèses, alors le séquent est prouvable. 


2. Affaiblissement: 


ri -a 


Y,BYA 




(1.31) 


Explications: 

- De haut en bas: si nous démontrons A sous les hypothèses T , en ajoutant d'autres hypothèses on peut 
encore démontrer A. 

- De bas en haut: il y a des hypothèses qui peuvent ne pas servir 

3. Introduction de l'implication: 


Y,AYB 
----A 

YYA^B 


(1.32) 


- De bas en haut: pour montrer que A —> B nous supposons A (c'est-à-dire que nous l'ajoutons aux 
hypothèses) et nous démontrons B. 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


46/4839 













Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

4. Elimination de l'implication: 


TJ-A^B fb.4 

tTb 


(1.33) 


- De bas en haut: pour démontrer B, si nous connaissons un théorème de la forme A —> B et si nous 
pouvons démontrer le lemme A —> B , il suffit de démontrer A. 


5. Introduction à la conjonction: 


r\-A rb b 

rhÂ/\B 


(1.34) 


- De bas en haut: pour montrer A A B, il suffit de montrer A et de montrer B. 


6. Elimination de la conjonction: 


r \-AAB . , 

-Aj: 

r b A 


(1.35) et 


T\-AAB Af 

r b b 


(1.36) 


- De haut en bas: de A A B , nous pouvons déduire A (élimination gauche) et B (élimination droite). 


7. Introduction de la disjonction: 


r b a 
TTÂvb 


Vf 


(1.37) OU 


r h b 
FTÂvb 


vf 


(1.38) 


- De bas en haut: pour démontrer A V B, il suffit de démontrer^ (disjonction gauche) ou de démontrer 
B (disjonction droite). 

8. Elimination de la disjonction: 


rb^V5 r.^bc r,5bc w 
r bc ‘ 


(1.39) 


- De bas en haut: si nous voulons montrer C et que nous savons que nous avons A V B , il suffit de le 
montrer d'une part en supposant A, d'autre part en supposant B. C'est un raisonnement par cas. 


9. Introduction de la négation: 


r,A\-i 


fb-ul 


(1.40) 


- De bas en haut: pour montrer —\A, nous supposons^ et nous démontrons l'absurde (_|_ ). 


10. Elimination de la négation: 


rb-i4 rb.4 

TKL 


(1.41) 


- De haut en bas: si nous avons montré —\A et A, alors nous avons montré l'absurde ( 1 ) 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


47/4839 
























Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

11. Absurdité classique: 


r,^n ± 

ri- a ' 


(1.42) 


- De bas en haut: pour démontrer 4 il suffit de démontrer l'absurde en supposant —iA- 


Cette règle, est équivalente à dire: A est vraie si et seulement si il est faux que A soit fausse. Cette règle 
ne va pas de soi: elle est nécessaire pour prouver certains résultats (il y a des résultats que nous ne 
pouvons pas prouver si nous n'avons pas cette règle). Contrairement, à beaucoup d'autres, cette règle 
peut par ailleurs être appliquée à tout moment. Nous pouvons, en effet, toujours dire: pour prouver A je 
suppose —iA et je vais chercher une contradiction. 

12. Introduction du quantificateur universel: 


f h A x n'est pas libre dans les formules de T 


h VlI 


V, 


(1.43) 


- De bas en haut: pour démontrer Vxd, il suffit de montrer A en ne faisant aucune hypothèse sur x. 


Remarque: pour des démonstrations cette vérification (aucune hypothèse sur x) est souvent source 
d'erreur. 


13. Elimination du quantificateur universel: 


ri- v?a 
ri-4*:=*] ' 


(1.44) 


- De haut en bas: de VxA , nous pouvons déduire J\x: = t] pour n'importe quel terme t. Ce que nous 
pouvons dire aussi sous la forme: si nous avons prouvé A pour tout x, alors nous pouvons utiliser A avec 
n'importe quel objet t (! !). 


14. Introduction du quantificateur existentiel: 


T\-A[x: = t] 3 
T\-3xA 1 


(1.45) 


- De bas en haut: pour démontrer 3xA, il suffit de trouver un objet (in extenso un terme t ) pour lequel 
nous savons montrer 4 x : = t ]. 


15. Elimination du quantificateur existentiel: 


f b 3xA T,A h C x n'est libre ni dans les formule de T, ni dans C 


r\-c 


(1.46) 


- De bas en haut: nous démontrons qu'il existe bien un ensemble d'hypothèses tel que 3xA et partant de 
ce résultat comme nouvelle hypothèse, nous démontrons C. Cette formule C hérite alors de la formule 
3xA et dès lors x n'est pas libre dans C car il ne l'était déjà pas dans 3xA ■ 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


48/4839 





















Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

16. Introduction de l'égalité: 


r h t = t 


(1.47) 


De bas en haut: nous pouvons toujours montrer t=t. Cette règle signifie que l'égalité est réflexive (cf. 

chapitre Opérateurs). 

17. Elimination de l'égalité: 


n-4*:-f] ri -t = u 
n-4x:=u] 


(1.48) 


- De haut en bas: si nous avons démontré T h A[x: = t] et t=u, alors nous avons démontré A[ x : = u]. 
Cette règle exprime que les objets égaux ont les mêmes propriétés. Nous noterons cependant que les 
formules (ou relations) t=u et u=t ne sont pas, formellement, identiques. Il nous faudra démontrer que 
l'égalité est symétrique (nous en profiterons aussi pour démontrer que l'égalité est transitive). 


Exemples: 

El. Cet exemple montre que l'égalité est symétrique (un petit peu non trivial mais bon pour 
commencer): 


x l =x 2 \-x 1 = 


Xj = x 2 h Xj = x 2 


-ax 


Xj = x a I~ x a = x x 

h Xi = X 2 ^ X 2 = Xj 




, -7 V i x2 

\-Vx l ,X 2 {x 1 =X 2 ^X 2 = Xj) 


(1.49) 


- De haut en bas: nous introduisons l'égalité = ; et prouvons à partir de l'hypothèse Xj = x 2 la formule 
Xj = Xj. En même temps, nous définissons l'axiome comme quoi x 1 = x 2 . Ensuite à partir de ces 
prémisses, nous éliminons l'égalité = e en substituant les termes de façon à ce qu'à partir de la 
supposition Xj = x 2 (venant de l'axiome) nous obtenions x 2 = Xj. Ensuite, l'élimination de l'égalité 
implique automatiquement sans aucune hypothèse que Xj = x 2 —> x 2 = Xj. Dès lors, il nous suffit 

d'introduire le quantificateur universel pour chacune des variables (donc deux fois) sans aucune 
hypothèse afin d'obtenir que l'égalité est symétrique. 

E2. Cet exemple montre que l'égalité est transitive (c'est-à-dire si x 1 = x 2 et x 2 = x 3 alors Xj = x 3 ). En 
notant F la formule x 1 = x 2 /\ x 2 = x 3 : 


-ax 


-ax 


F Fl-*-* A*-* K 


F \-x 1 -x 2 


F \~ x 2 = x 3 


F h Xj = x 3 


=, (1-50) 




h (x x = x 2 Ax 2 =x 3 )^x t =. 
Vx l? x 2 ? x l {(x l = X 2 A X 2 = X 3 ) —> X l = ! 


-V, x 3 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


49/4839 






















Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

Que faisons, nous ici ? Nous introduisons d'abord la formule F deux fois en tant qu'axiome afin de la 
décortiquer plus tard à gauche et à droite (nous n'introduisons pas l'égalité supposée déjà introduite en 
tant que règle). Une fois ceci fait, nous éliminons à gauche et à droite la conjonction sur la formule pour 
travailler sur les termes gauches et droites seuls et introduisons l'égalité sur les deux termes ce qui fait 
qu'à partir de la formule nous avons l'égalité transitive. Il s'ensuit que sans aucune hypothèse cela 
implique automatiquement que l'égalité est transitive et finalement nous disons que ceci est valable 
pour toute valeur des différentes variables (si la formule est vraie, alors l'égalité est transitive). 

E3. L'objectif sera de démontrer que toute involution est une bijection (cf. chapitre de Théorie Des 
Ensembles). Soit/un symbole de fonction unaire (à une variable), nous notons (pour plus de détails 
voir le chapitre de Théorie Des Ensembles): 

- lnj[f] la formule: 


Vx.y /O) =/0)^ * = y (i-5i) 


qui signifie que / est injective. 
- 3urj[/\ la formule: 


V y 3a- f(x) = y (1.52) 


qui signifie que/ est surjective 
- Bij[f] la formule: 


toj[f]l\Surj[f] (1.53) 


qui signifie que / est bijective. 
- /«>{/] la formule: 


V* /(/(*))=* (1.54) 

qui signifie que/ est une involution (nous notons également cela f °f = Id c'est-à-dire que la 
composition de/ est l'identité). 

Nous aimerions savoir si: 


Inv[f]\-Bij[f] (1.55) 

Nous allons présenter (en essayant que ce soit au plus clair) cette démonstration de quatre manières 
différentes: classique (informelle), classique (pseudo-formelle), formelle en arbre et formelle en ligne. 

Méthode classique: 

Nous devons montrer que si/est involutive alors elle est donc bijective. Nous avons donc deux choses 
à montrer (et les deux doivent être satisfaites en même temps): que la fonction est injective et 
surjective. 

1. Montrons que l'involution est injective. Nous supposons pour cela, puisque/est involutive elle est 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


50/4839 






Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


donc injective, tel que: 

Vx,yf{x) = f(y) (1.56) 

implique: 

x=y (1.57) 

Or, cette supposition découle automatiquement de la définition de l'involution que: 

V*/(/0)) = *,Yy/(/0)) = y (1.58) 


et de l'application de/à la relation: 


(soit trois égalités) tel que: 


/(/ = /O) (1-59) 


/C/W)=/(/W) (1-60) 


nous avons donc: 


* = y (i.6i) 

2. Montrons que l'involution est surjective: si elle est surjective, alors nous devons avoir: 

Vy3x/(x)=.y (1.62) 

Or, définissons la variable x par définition de l'involution elle-même: 

*:= f(y) (1.63) 

(puisque y = f(x )...) un changement de variables après nous obtenons: 

f(J(y)) = y ( 1 - 64 ) 

et donc la surjectivité est assurée. 

Méthode pseudo-formelle: 

Nous reprenons la même chose et nous y injectons les règles de la théorie de la démonstration: 

Nous devons montrer que/involutive est donc bijective. Nous avons donc deux choses à montrer (A.,) 
(et les deux doivent être satisfaites en même temps): que la fonction est injective et surjective: 

MnASurAf] (1-65) 

1. Montrons d'abord que l'involution est injective. Nous supposons pour cela, puisque/est involutive et 
donc injective, que: 

(Vi) Vx,yf(x) =f(y) ( 1 . 66 ) 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


51/4839 






Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

implique: 


(->i) * = ^ (1-67) 


Or, cette supposition découle automatiquement de la définition de l'involution que: 

(V^.ax) Vx/(/(x)) = x,Vy/(/0)) =7 ( 1 . 68 ) 
et de l'application de/à la relation: 


/(*) = J (y) (i.69) 


(soit trois égalités = e x2 ) tel que: 


/t/toWC/OO) (1.70) 


nous avons donc: 


* = y (i.7i) 

2. Montrons que l'involution est surjective. Si elle est surjective, alors nous devons avoir: 

VyH* j(x) = y ('/ ) (1.72) 

Or, définissons la variable x par définition de l'involution elle-même: 

(3)*:=/O) 0-73) 

(puisque y = f(x) ...) un changement de variables après nous obtenons: 

f(J(y))=y (i.74) 

et donc: 

(V^ax) (1-75) 

la surjectivité est assurée. 

Méthode formelle en arbre: 

Faisons cela avec la méthode graphique que nous avons déjà présentée plus haut. 

1. Montrons que l'involution est injective: 

Pour cela, montrons d'abord que: 

/W = /O) I- /(/(*)) = (1.76) 

Donc: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


52/4839 






Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


lnvU]^y{f(J(y)) = y} 


-ax 


-V, 


/^v[/]H{/Cy) = 4b:=/W] c fW-f(y)\-Xx)-f (y) 
/W = /0)H{/W=M[^:=/(7)] 


-ax 


= e ( 1 ) 


M/]i-v*{y(y(*)) = ^ v _ ûjr ( L77 > 

M/]^tyw = y)[*:~y(y)] * yw-yçy)i-y(^)-y(y) / 2 \ 

yco = yo)i-{yoo = *}i>:=yoo] s 

■ . j 

V 


_(1H2)_ 

yw = yw^ycyw) = /(/<») 


= e (3) 



Dès lors: 


-ax - ax 

M/l -> M/l v M/l -> M/l v 
M/ll-ycraM* * M/]l-/(/(y)) = y * _ 

_ y(y(x)) = y(y(y))l-jr = y _ e (3) r4 , (1-78) 

M/l,y(*) =/(?)!-*= y ^ ‘ w 

M/l I- yfr) = /(y) -> x = y v 

M/l I- M/l 

2. Montrons que l’involution est surjective: 


M/]H/P)=y)[*:=y(y)] ‘ 

M/]h3x{/(x)=M _ 

/»v[/]i-^dy] iW 


Il s'ensuit: 


(5) (6) 

My]hMy]AM/] 


\ 


( 1 . 80 ) 


Méthode formelle en ligne: 

Nous pouvons faire la même chose sous une forme un peu moins... large... et plus tabulée... (cela n'en 
est pas moins indigeste): 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


53/4839 


































Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


inv[/]\-mn V; 

l:=/«v[/]hM/] 

2 := în^f] b Surj[f] 

(1) /«v[/]hM/] Vj 

Inv[f]\-f(x) = f(y)->x = y 

lnv[f],f(x) = /O) h * = y = e x 2 (ï)(ïï)(ï!ï) 

(i) In^f] b /(/(*)) = x V, 

/*v[/]b/*v[/] æ* 

(ïï) 7«v[/] b /(/(y)) =7 V, 

M/]b/«v[/] 

(ïïï) /O) = /O) b /(/(*)) = /(/O)) = f 

(1 r )/W = /(7)^/W = /0) 

(2) M/] I- «/] Vj 

/«v[/]b34/W = M 3 

/»v[/] h {/(x)=tf [*:=/(>)] V, 

Inv[f]\-Vx{f(f(x))=x] 

( 1 . 81 ) 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


54/4839 






Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 



[Vincent ISOZ] | http://www.sciences.ch] | Page: 


55/4839 






















































































Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


56/4839 






















































































Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


57/4839 






















































































Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


58/4839 






















































































Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


2. NOMBRES 


1-^/a base des mathématiques, mis à part le raisonnement (cf. chapitre Théorie De La Démonstration), 

est sans nul doute pour le commun des personnes l'arithmétique. Il est donc obligatoire que nous y 
fassions étape pour étudier sa provenance, quelques-unes de ses propriétés et conséquences. 

Les nombres, comme les figures géométriques, constituent les bases de l'arithmétique. Ce sont aussi les 
bases historiques car les mathématiques ont certainement commencé par l'étude de ces objets, mais 
aussi les bases pédagogiques, car c'est en apprenant à compter que nous entrons dans le monde des 
mathématiques. 

L'histoire des nombres, appelés également parfois "scalaires", est beaucoup trop longue pour être 
relatée ici, mais nous ne pouvons que vous conseiller un des meilleurs ouvrages francophones sur le 
sujet: Histoire Universelle des chiffres (~2'000 pages), Georges Iffah, ISBN: 2221057791. 

Cependant voici une petite bride de cette dernière qui nous semble fondamentale: 

Notre système décimal actuel, de base 10, utilise les chiffres de 0 à 9, dits "chiffres arabes", mais au fait 
d'origine indienne (hindous). Effectivement, les chiffres arabes (d'origine indienne...) dans le tableau 
ci-dessous sont la première ligne et nous voyons qu'ils sont nettement différents des "chiffres indiens" 
de la deuxième ligne: 


* 

1 

r 

r 

i 

O 


Y 

A 

s 

0 

1 

2 

3 

4 

5 

6 

7 

8 

9 


Tableau: 2.1 - Chiffres arabes 


Il faut lire dans ce tableau: 0 "zéro", 1 "un", 2 "deux", 3 "trois", 4 "quatre", 5 "cinq", 6 "six", 7 "sept", 8 
"huit", 9 "neuf'. Ce système est beaucoup plus efficace que les chiffres romains (essayez de faire un 
calcul avec le système de notation romain vous allez voir...). 

Ces chiffres ne furent introduits en Europe que vers l'an 1000. Utilisés en Inde, ils furent transmis par 
des Arabes au monde occidental par le pape Gerbert d'Aurillac lors de son séjour en Andalousie à la fin 
du 9ème siècle. 


C~ ' ' \ 

Remarque: Le mot français "chiffre" est une déformation du mot arabe "sifr" désignant "zéro". En 
italien, "zéro" se dit "zéro", et serait une contraction de "zefiro", on voit là encore la racine arabe 
mais le zéro serait aussi d'origine indienne... Ainsi nos termes "chiffre" et "zéro" ont la même 
origine. 

_ / 


L'usage précoce d'un symbole numérique désignant "rien", au sens de "aucune quantité" ou "absence 
de quantité", c'est à dire notre zéro, provient du fait que les indiens utilisèrent un système dit "système 
positionnel". Dans un tel système, la position d'un chiffre dans l'écriture d'un nombre exprime la 
puissance de 10 et le nombre de fois qu'elle intervient... et l'absence d'une position dans ce système 
posait d'énormes problèmes de relecture et pouvait engendrer de grosses erreurs de calculs. 
L'introduction révolutionnaire et pourtant simple du concept de rien permettait un relecture sans erreur 
des nombres. 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


59/4839 























Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

L'absence d'une puissance est notée par un petit rond...: c'est le zéro. Notre système actuel est donc le 
"système décimal et positionnel". 

Exemple: 

Description du système décimal et positionnel: 


IQ 2 I0 1 10° 

1 i I 

324 = 3x100 + 2x10 + 4x1 

unités-1 

dizaines- 

centaines — 

Figure: 2.1 - Description système décimal et positionnel 


Le nombre 324 s'écrit de gauche à droite comme étant trois centaines: 3 fois 100, deux dizaines: 2 fois 
10 et quatre unités: 4 fois 1. 



Nous voyons parfois (et c'est conseillé) un séparateur de milliers représenté par une apostrophe ' en 
Suisse (posé tous les trois chiffres à partir du premier en partant de la droite pour les nombres entiers). 
Ainsi, nous écrirons l'034 au lieu de 1034 ou encore l'344'567'569 au lieu de 1344567569. Les 
séparateurs de milliers permettent de rapidement quantifier l'ordre de grandeur des nombres lus. 

A in si: 

- Si nous voyons uniquement une apostrophe nous saurons que le nombre est de l'ordre du millier 

- Si nous voyons deux apostrophes nous saurons que le nombre est de l'ordre du mi l li on 

- Si nous voyons trois apostrophes nous saurons que le nombre est de l'ordre du milliard 

et ainsi de suite... 

Au fait, tout nombre entier, autre que l'unité, peut être pris pour base d'un système de numérotation. 
Nous avons ainsi les systèmes de numérotation binaire, ternaire, quaternaire,..., décimal, duodécimal 
qui correspondent respectivement aux bases deux, trois, quatre,..., dix, douze. 

Une généralisation de ce qui a été vu précédemment, peut s'écrire sous la forme suivante: 

Tout nombre entier positif peut être représenté dans une base b sous forme de somme, où les 
coefficients ^ sont multipliés chacun par leur poids respectif ÿ ■ Tel que: 

N = + a s _ 2 b”~ 2 +... + fljù 1 + a 0 b° (2.1) 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


60/4839 






















Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

Plus élégamment écrit: 


i-0 


( 2 . 2 ) 


avec e[0;è-l] et ^e[0;è s -1]. 


Ç 

Remarques: 




RI. Comme très fréquemment en mathématique, nous remplacerons l'écriture des chiffres ou des 
nombres par des lettres latines ou grecques afin de généraliser leur représentation. Ainsi, lorsque 
nous parlons d'une base b la valeur b peut prendre n'importe quelle valeur entière 1, 2, 3,... 


R2. Lorsque nous prenons la valeur 2 pour b, N aura pour valeur maximale 2" - 1 • Les nombres qui 
s'écrivent sous cette forme s'appellent les "nombres de Mersenne". Ces nombres ne peuvent être 
premiers (voir plus bas ce qu'est un nombre premier) que si n est premier. 


Effectivement, si nous prenons (par exemples) b = 10 et « = 3 la plus grande valeur que nous 
pourrons avoir sera alors: 


(b -1)'10 2 + (È-1)'10 1 + (à-l)'10° = 900 + 90 + 9 = 999= 10 3 -\ = b l -1 (2.3) 

R3. Lorsque qu'un nombre est le même lu de gauche à droite ou de droite à gauche, nous parlons de 
"nombre palindrome". 

V_ J 

1. BASES NUMÉRIQUES 

Pour écrire un nombre dans un système de base b, nous devons commencer par adopter b caractères 
destinés à représenter les b premiers nombres {0, 1, 2, 3, 4, 5, 6, 7, 9}. Ces caractères sont comme nous 
les avons déjà définis, les "chiffres" que nous énonçons comme à l'ordinaire. 

Pour la numérotation écrite, nous faisons cette convention, qu'un chiffre, placé à gauche d'un autre 
représente des unités de l'ordre immédiatement supérieur, ou b fois plus grandes. Pour tenir la place des 
unités qui peuvent manquer dans certains ordres, nous nous servons du zéro (0) et par suite, le nombre 
de chiffres employés peut varier. 

Définition: Pour la numérotation parlée, nous convenons d'appeler "unité simple", "dizaine", 

"centaine", "millier", etc., les unités du premier ordre, du second, du troisième, du quatrième, etc. Ainsi 
les nombres 10, 11,..., 19 se liront de même dans tous les systèmes de numérotation. Les nombres la, 
lb, aO, bO,... se liront dix-a, dix-bé, a-dix, bé-dix, etc. Ainsi, le nombre 5b6a71c se lira: 

cinq millions bé-cent soixante-a mille sept cent dix-cé 

Cet exemple est pertinent car il nous montre l'expression générale de la langue parlée que nous utilisons 
quotidiennement et intuitivement en base dix (faute à notre éducation). 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


61/4839 














Voyons comment nous convertissons un système de numérotation dans un ordre: 

Exemple: 

En base dix nous savons que 142713 s'écrit: 

142'713 10 = MO 5 + 4'10 4 + 2 ■ 10 3 + 7 ■ 10 a +1 ■ 10 1 + 3 ■ 10° (2.4) 
En base deux (base binaire) le nombre 0110 s'écrirait en base 10: 

0110 a =0' 2 3 +1 ■ 2 2 + !■ 2 1 + 0'2° = 6 m (2.5) 


et ainsi de suite... 


L'inverse (pour l'exemple de la base deux) est toujours un peu plus délicat. Par exemple la conversion 
du nombre décimal l'492 en base deux se fait par divisions successives par 2 des restes et donne (le 
principe est à peu près identique pour toutes les autres bases): 


quotient 


1492 

746 

373 

186 

93 

46 

23 

11 

5 

2 

1 

0 


reste 



Ainsi, pour convertir le nombre 142713 (base décimale) en base duodécimale (base douze) nous avons 
(notation: q est le "quotient", et r le "reste"): 

142 '713 

— = 11'392 ,r = 9 (2.6) 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


62/4839 















Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


11'892 

12 


?=991,r = 0 (2.7) 


991 

—— => q = 82,r = 7 (2.8) 
12 


82 

— =>q = 6,r = 10 (2.9) 


— => q = 0,/" = 6 (2.10) 
12 


Ainsi nous avons les restes 6, 10, 7, 0, 9 ce qui nous amène à écrire: 

142'713 lû = 6a709 12 (2.11) 


Nous avons choisi pour ce cas particulier la symbolique que nous avions définie précédemment (a-dix) 
pour éviter toute confusion. 

2. TYPES DE NOMBRES 


Il existe en mathématiques une très grande variété de nombres (naturels, rationnels, réels, irrationnels, 
complexes, p-adiques, quatemions, transcendants, algébriques, constructibles...) puisque le 
mathématicien peut à loisirs en créer en ayant uniquement à poser les axiomes (règles) de 
manipulations de ceux-ci (cf. chapitre de Théorie Des Ensembles). 

Cependant, il y en a quelques-uns que nous retrouvons plus souvent que d'autres et certains qui servent 
de base de construction à d'autres et qu'il conviendrait de définir suffisamment rigoureusement (sans 
aller dans les extrêmes) pour pouvoir savoir de quoi nous parlerons lorsque nous les utiliserons. 

2.1. NOMBRES ENTIERS NATURELS 

L'idée du "nombre entier" (nombre pour lequel il n'y a pas de chiffres après la virgule) est le concept 
fondamental de la mathématique et nous vient à la vue d'un groupement d'objets de même espèce (un 
mouton, un autre mouton, encore un autre, etc.). Lorsque la quantité d'objets d'un groupe est différente 
de celle d'un autre groupe nous parlons alors de groupe numériquement supérieur ou inférieur quel que 
soit l'espèce d'objets contenus dans ces groupes. Lorsque la quantité d'objets d'un ou de plusieurs 
groupes est équivalente, nous parlons alors "d'égalité". A chaque objet correspond le nombre "un" ou 
"unité" noté "1". 

Pour former des groupements d'objets, nous pouvons opérer ainsi: à un objet, ajouter un autre objet, 
puis encore un et ainsi de suite... chacun des groupements, au point de vue de sa collectivité, est 
caractérisé par un nombre. Il résulte de là qu'un nombre peut être considéré comme représentant un 
groupement d'unités tel que chacune de ces unités corresponde à un objet de la collection. 

Définition: Deux nombres sont dits "égaux" si à chacune des unités de l'un nous pouvons faire 
correspondre une unité de l'autre et inversement. Si ceci ne se vérifie pas alors nous parlons 
"d'inégalité". 

Prenons un objet, puis un autre, puis au groupement formé, ajoutons encore un objet et ainsi de suite. 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


63/4839 









Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

Les groupements ainsi constitués sont caractérisés par des nombres qui, considérés dans le même ordre 
que les groupements successivement obtenus, constituent la "suite naturelle" N et notée: 

N = {0;1; 2; 3;4...} (2.12) 

Remarque: La présence du 0 (zéro) dans notre définition de N est discutable étant donné qu'il n'est 
ni positif ni négatif. C'est la raison pour laquelle dans certains ouvrages vous pourrez trouver une 
définition de N sans le 0. 

^___ J 

Les constituants de cet ensemble peuvent être définis par (nous devons cette définition au 
mathématicien Gottlob) les propriétés (avoir lu au préalable le chapitre de Théorie Des Ensembles est 
recommandé...) suivantes: 

PL 0 (lire "zéro") est le nombre d'éléments (défini comme une relation d'équivalence) de tous les 
ensembles équivalents à (en bijection avec) l'ensemble vide. 

P2. 1 (lire "un") est le nombre d'éléments de tous les ensembles équivalents à l'ensemble dont le seul 
élément est 1. 

P3. 2 (lire "deux") est le nombre d'éléments de tous les ensembles équivalents à l'ensemble dont tous les 
éléments sont 0 et 1. 

P4. En général, un nombre entier est le nombre d'éléments de tous les ensembles équivalents à 
l'ensemble des nombres entiers le précédant! 

La construction de l'ensemble des entiers naturels s'est faite de la manière la plus naturelle et cohérente 
qui soit. Les naturels doivent leur nom à ce qu'ils avaient pour objet, aux prémices de leur existence, de 
dénombrer des quantités et des choses de la nature ou qui intervenaient dans la vie de l'homme. 
L'originalité de l'ensemble réside dans la manière empirique dont il s'est construit car il ne résulte pas 
réellement d'une définition mathématique, mais davantage d'une prise de conscience par l'homme du 
concept de quantité dénombrable, de nombre et de lois qui traduisent des relations entre eux. 

La question de l'origine de N est dès lors la question de l'origine des mathématiques. Et de tout temps 
des débats confrontant les pensées des plus grands esprits philosophiques ont tenté d'élucider ce 
profond mystère, à savoir si les mathématiques sont une pure création de l'esprit humain ou si au 
contraire l'homme n'a fait que redécouvrir une science qui existait déjà dans la nature. Outre les 
nombreuses questions philosophiques que cet ensemble peut susciter, il n'en est pas moins intéressant 
d'un point de vue exclusivement mathématique. Du fait de sa structure, il présente des propriétés 
remarquables qui peuvent se révéler d'une grande utilité lorsque l'on pratique certains raisonnements ou 
calculs. 

Remarquons immédiatement que la suite naturelle des nombres entiers est illimitée (cf. chapitre de 
Théorie Des Nombres) mais dénombrable (nous verrons cela plus bas), car, à un groupement d'objets 
qui se trouve représenté par un certain nombre n, il suffira d'ajouter un objet pour obtenir un autre 
groupement qui sera défini par un nombre entier immédiatement supérieur n + 1. 

Définition: Deux nombres entiers qui différent d'une unité positive sont dits "consécutifs". 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


64/4839 












Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

2.1.1. AXIOMES DE PEANO 

Lors de la crise des fondements des mathématiques, les mathématiciens ont bien évidemment cherché à 
axiomatiser l'ensemble N et nous devons l'axiomatisation actuelle à Peano et à Dedekind. 

Les axiomes de ce système comportent les symboles < et = pour représenter les relations "plus petit" et 
"égal" (cf. chapitre sur les Opérateurs). Ils comprennent d'autre part les symboles 0 pour le nombre zéro 
et 5 pour représenter le nombre "successeur". Dans ce système, 1 est noté: 

s(0) (2.13) 


dit "successeur de zéro", 2 est noté: 


s(s(0)) (2.14) 

Les axiomes de Peano qui construisent N sont les suivants (voir le chapitre de la Théorie de la 
Démonstration pour certains symboles): 

Al. 0 est un entier naturel (permet de poser que N n'est pas vide). 

A2. Tout entier naturel a un successeur, noté s(n). 

Donc ^ est une application injective, c'est- à-dire: 

s(x) = s(y) => x = y (2.15) 

si deux successeurs sont égaux, ils sont les successeurs d'un même nombre. 

A3. ’Vx-'ls(x) = 0), le successeur d'un entier naturel n'est jamais égal à zéro (ainsi N à un premier 
élément) 

A4. (jj(0) AVx ( çx'x) => <p(s(x)) => Vx çx'x) , "axiome de récurrence" qui se doit se lire de la manière 

suivante: si l'on démontre qu'une propriété est vraie pour un x et son successeur, alors cette propriété 
est vraie pout tout x. 

Donc l'ensemble de tous les nombres vérifiant les 4 axiomes est: 


N = {0,1,2,3,...,*,...} 


(2.16) 


C7~? -^ 

Remarque: Les axiomes de Peano permettent de construire très rigoureusement les deux opérations 
de base de l'arithmétique que sont l'addition et la multiplication (cf. chapitre sur les Opérateurs) et 

ainsi tous les autres ensembles que nous verrons par la suite. 

V___/ 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


65/4839 












Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

2.2. NOMBRES PAIRS, IMPAIRS ET PARFAITS 

En arithmétique, étudier la parité d'un entier, c'est déterminer si cet entier est ou non un multiple de 
deux. Un entier multiple de deux est un entier pair, les autres sont les entiers impairs. 

Définitions: 

Dl. Les nombres obtenus en comptant par deux à partir de zéro, (soit 0, 2, 4, 6, 8,...) dans cette suite 
naturelle sont appelés "nombres pairs". 

Le n'*™ nombre pair est donné par la relation: 

(« + «) = 2 n (2.17) 

D2. Les nombres que nous obtenons en comptant par deux à partir de un (soit 1, 3, 5, 7,... ) dans cette 
suite naturelle s'appellent "nombres impairs". 

Le {n + nombre impair est donné par: 


(2m+ 1) (2.18) 


Remarque: Nous appelons "nombres parfaits", les nombres égaux à la somme de leurs diviseurs 
entiers strictement plus petits qu'eux mêmes (concept que nous verrons en détail plus tard) comme 
par exemple: 6=l+2+3 et 28=1+2+4+7+14. 


N 


2.2.1. NOMBRES PREMIERS 

Définition: Un "nombre premier" est un entier possédant exactement 2 diviseurs (ces deux diviseurs 
sont donc "1" et le nombre lui-même). Dans le cas où il y a plus de 2 diviseurs on parle de "nombre 
composé". 

Voici l'ensemble des nombres premiers inférieurs à 60: 

{2,3,5,7,11,13,17,19,23,29,31,37,41,43,47,53,59} 


--- 

Remarque: A noter que la définition de nombre premier exclut le chiffre " 1 " de l'ensemble des 
nombres premiers car il a un unique diviseur (lui-même) et pas deux comme le veut la définition. 

_____ / 


Nous pouvons nous demander s'il existe une infinité de nombres premiers ? La réponse est positive et 
en voici une démonstration (parmi tant d'autres) par l'absurde. 

Démonstration: 

Supposons qu'il n'existe qu'un nombre fini de nombres premiers qui seraient: 

Pl.Pl.-.P* ( 2 - 19 > 

Nous formons un nouveau nombre à partir du produit de tous les nombres premiers auquel nous 
ajoutons "1": 

[Vincent ISOZ] | http://www.sciences.ch] | Page: 


66/4839 


















Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

N = PiPi-Px+l ( 2 . 20 ) 

Selon notre hypothèse initiale et le théorème fondamental de l'arithmétique (cf. chapitre de Théorie Des 
Nombres) ce nouveau nombre devrait être divisible par l'un des nombres premiers existants selon: 

N = q- Pi (2.21) 

Nous pouvons effectuer la division: 

+ (2 , 22) 

Pi Pi Pi 

Le premier terme se simplifie, car Pi est dans le produit. Nous notons E cet entier: 

q=E + \f Pi (2.23) 

Or, q et E sont deux entiers, donc 1 / Pi doit être un entier. Mais Pi est par définition supérieur à 1. 
Donc 1 ! Pi n'est pas un entier. 

Il y a alors contradiction et nous en concluons que les nombres premiers ne sont pas en nombre fini, 
mais infini. 


□C.Q.F.D. 



2,3. NOMBRES ENTIERS RELATIFS 


L'ensemble N à quelques défauts que nous n'avons pas énoncés tout à l'heure. Par exemple, la 
soustraction de deux nombres dans N n'a pas toujours un résultat dans N (les nombres négatifs n'y 
existent pas). Autre défaut, la division de deux nombres dans N n'a également pas toujours un résultant 
dans N (les nombres fractionnaires n'y existent pas). 

Nous pouvons dans un premier temps résoudre le problème de la soustraction en ajoutant à l'ensemble 
des entiers naturels, les entiers négatifs (concept révolutionnaire pour ceux qui en sont à l'origine) nous 
obtenons "l'ensemble des entiers relatifs" noté Z (pour "Zahl" de l'allemand): 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


67/4839 


















Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


Z = {...;-3; -2;-l;0;l; 2; 3;...} 


(2.24) 


L'ensemble des entiers naturels est donc inclus dans l'ensemble des entiers relatifs. C'est ce que nous 
notons sous la forme: 


NcZ (2.25) 

et nous avons par définition (c'est une notation qu'il faut apprendre): 

Z + = N (2.26) 

Cet ensemble a été créé à l'origine pour faire de l'ensemble des entiers naturels un objet que nous 
appelons un "groupe" (cf. chapitre Théorie Des Ensembles) par rapport à l'addition. 

Définition: Nous disons qu'un ensemble E est un "ensemble dénombrable", s'il est équipotent à N • 
C'est-à-dire s'il existe une bijection de (cf. chapitre Théorie Des Ensembles) N sur E. Ainsi, grosso 
modo, deux ensembles équipotents ont "autant" d'éléments au sens de leurs cardinaux (cf. chapitre de 
Théorie Des Ensembles), ou tout au moins la même infinité. 

L'objectif de cette remarque est de faire comprendre que les ensembles N, Z sont dénombrables. 

Démonstration: 

Montrons que Z est dénombrable en posant: 

= ^ et x 2Jt+1 = —k — 1 (2.27) 

pour tout entier k > 0 . Ceci donne l'énumération suivante: 

0,-1,1,-2,2,-3,3,... (2.28) 

de tous les entiers relatifs à partir des entiers naturels seuls. 


□C.Q.F.D. 


2,4. NOMBRES RATIONNELS 

L'ensemble Z a aussi un défaut. Ainsi, la division de deux nombres dans Z n'a également pas toujours 
un résultat dans Z (les nombres fractionnaires n'y existent pas). Nous disons alors dans le langage de la 
théorie des ensembles que: la division n'est pas une opération interne dans Z • 

Nous pouvons ainsi définir un nouvel ensemble qui contient tous les nombres qui peuvent s'écrire sous 
forme de "fraction", c'est-à-dire du rapport d'un dividende (numérateur) et d'un diviseur 
(dénominateur). Quand un nombre peut se mettre sous cette forme, nous disons que c'est une "nombre 
fractionnaire": 


\/ numérateur 

f 2 

fraction {— barre de fraction 
\ dénominateur 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


68/4839 








Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

Figure: 2.3 - Construction nombre fractionnaire 


Une fraction peut être employée pour exprimer une partie, ou une part, de quelque chose 
(d'un objet, d'une distance, d'un terrain, d'une somme d'argent...). 

Par définition, "l'ensemble des nombres rationnels" est donné par: 



' p, q ' e %q * 0 


} 


(2.29) 


et où/? et q sont des entiers sans facteurs communs (autrement dit la fraction plq est écrite sous forme 
irréductible). 

Nous supposerons par ailleurs comme évident que: 

N,Zc(Q (2.30) 


La logique de la création de l'ensemble des nombres rationnels est similaire à celle des entiers relatifs. 
Effectivement, les mathématiciens ont souhaité faire de l'ensemble des nombres relatifs un "groupe" par 
rapport à la loi de multiplication et de division (cf. chapitre de Théorie Des Ensembles). 

De plus, contrairement à l'intuition, l'ensemble des nombres entiers et nombres rationnels sont 
équipotents. Nous pouvons nous persuader de cette équipotence en rangeant comme le fit Cantor, les 
rationnels dans un premier temps de la façon suivante: 



Figure: 2.4 - Métode diagonale de Cantor 


Ce tableau est construit de telle manière que chaque rationnel n'apparaît qu'une seule fois (au sens de sa 
valeur décimale) par diagonale d'où le nom de la méthode: "diagonale de Cantor". 

Si nous éléminons de chaque diagonale les rationnels qui apparaissent plus d'une fois (les "fractions 
équivalentes") pour ne garder plus que ceux qui sont irréductibles (donc ceux dont le PGCD du 
numérateur et dénominateur est égal à 1), nous pouvons alors ainsi grâce à cette distinction définir une 
application / : N —> Q qui est injective (deux rationnels distincts admettent des rangs distincts) et 
surjective (à toute place sera inscrit un rationnel). 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


69/4839 







Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

L'application/est donc bijective: N et (Q sont donc bien équipotents ! 

La définition un peu plus rigoureuse (et donc moins sympathique) de (Q se fait à partir de Z en 
procédant comme suit (il est intéressant d'observer les notations utilisées) : 

Sur l'ensemble Z x Z \ {0}, qu'il faut lire comme étant l'ensemble construit à partir de deux éléments 
entiers relatifs dont on exclut le zéro pour le deuxième, on considère la relation R entre deux couples 
d'entiers relatifs définie par: 


(a,b)R(a',b') a 1 b‘ = a'b (2.31) 

Nous vérifions facilement ensuite que R est une relation d'équivalence (cf. chapitre sur les Opérateurs) 
sur ZxZ\ {0}. 

L'ensemble des classes d'équivalences pour cette relation R noté alors > Z xZ \ {0} '/ R est par définition 
(Q. C'est-à-dire que nous posons alors plus rigoureusement: 

Q = .ZxZ\{0} )IR (2.32) 

La classe d'équivalence de {a,b) e Z xZ \ {0} est explicitement notée par: 

a 

- (2.33) 

b 

conformément à la notation que tout le monde a l'habitude d'employer. 

Nous vérifions facilement que l'addition et la multiplication qui étaient des opérations définies sur Z 
passent sans problèmes à Q en posant: 

a p a~ p a p a,' q +è ■ p 

-• — = — — et - + — = — -— (2.34) 

b b ' c[ b b ' 

De plus ces opérations munissent (Q d'une structure de corps (cf. chapitre de Théorie Des Ensembles) 
avec y comme élément neutre additif et -j comme élément neutre multiplicatif. Ainsi, tout élément non 
nul de Q est inversible, en effet: 


a b _ ab _ 1 
b a ab 1 


(2.35) 


ce qui s'écrit aussi plus techniquement: 


(ab,ab)R(y,'ï) (2.36) 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


70/4839 








Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


rr~z -;-\ 

Remarque: Même si nous aurions envie de définir Q comme étant l'ensemble Z xZ \ {0} où Z 
représente les numérateurs et Z \ {0} les dénominateurs des rationnels, ceci n'est pas possible car 
autrement nous aurions par exemple (1,2) * (2,4) tandis que nous nous attendons à une égalité. 

D'où le besoin d'introduire une relation d'équivalence qui nous permet d'identifier, pour revenir à 
l'exemple précédent, (1,2) et (2,4). La relation R que nous avons définie ne tombe pas du ciel, en 
effet le lecteur qui a manipulé les rationnels jusqu'à présent sans jamais avoir vu leur définition 
formelle sait que: 


— = — a ' b’ = a’b (2.37) 
h b’ 

Il est donc naturel de définir la relation R comme nous l'avons fait. En particulier, en ce qui 

1 2 

concerne l'exemple ci-dessus, — = — car (l,2)/?(2,4) et le problème est résolu. 


_ / 

Outre les circonstances historiques de sa mise en place, ce nouvel ensemble se distingue des ensembles 
d'entiers relatifs car il induit la notion originale et paradoxale de quantité partielle. Cette notion qui a 
priori n'a pas de sens, trouvera sa place dans l'esprit de l'homme notamment grâce à la géométrie où 
l'idée de fraction de longueur, de proportion s'illustre plus intuitivement. 

2,5. NOMBRES IRRATIONNELS 

L'ensemble des rationnels Q est limité et non suffisant lui aussi. Effectivement, nous pourrions penser 
que tout calcul mathématique numérique avec les opérations communément connues se réduisent à cet 
ensemble mais ce n'est pas le cas. 

Exemples: 

El. Prenons le calcul de la racine carrée de deux que nous noterons jj /2 . Supposons que cette dernière 
racine soit un rationnel. Alors s'il s'agit bien d'un rationnel, nous devrions pouvoir l'exprimer comme 
alb , où par de par la définition d'un rationnel a et b sont des entiers sans facteurs communs. Pour cette 
raison, a et h ne peuvent tous les deux être pairs. Il y a trois possibilités restantes: 

1. a est impair (b est alors pair) 

2. a est pair (b est alors impair) 

3. a est impair (b est alors impair) 

En mettant au carré, nous avons: 



(2.38) 


qui peut s'écrire: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


71/4839 












Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

2 b 2 = a À (2-39) 

Puisque le carré d'un nombre impair est impair et le carré d'un nombre pair est pair, le cas (1) est 
impossible, car a 2 serait impair et 2b 2 serait pair. 

Le cas (2) est aussi impossible, car alors nous pourrions écrire a = 2c , où c est un entier quelconque, et 
donc si nous le portons au carré nous avons a 2 = 4c 2 où nous avons un nombre pair des deux côtés de 
l'égalité. En remplaçant dans 2 b 2 = a 2 nous obtenons après simplification que h 1 = 2c 2 • b 2 serait 
impair alors que 2c 2 serait pair. 

Le cas (3) est aussi impossible, car a 2 est donc alors impair et 2b 2 est pair (que b soit pair ou impair!). 

Il n'y a pas de solution! C'est donc que l'hypothèse de départ est fausse et qu'il n'existe pas deux entiers 
a et b tels que = a fb- 

E2. Démontrons, aussi par l'absurde, que le fameux nombre d'Euler e est irrationnel. Pour cela, 
rappelons que e (cf. chapitre d'Analyse Fonctionnelle) peut aussi être défini par la série de Taylor (cf. 
chapitre sur les Suites Et Séries): 


,111 1 

e = \+— + — + — + +— + ... 

1! 2! 3! n\ 


(2.40) 


Alors si e est rationnel, il doit pouvoir s'écrire sous la forme plq (avec q > 1, car nous savons que e n'est 
pas entier). Multiplions les deux côtés de l'égalité par q \: 


q\ 


■ + ■ 




^ =q i + îl + îl + îl + ... + îl+ 

1! 2! 3! q\ (?+!)! {q+2)\ 


+ . 


(2.41) 


Le premier membre q\e serait alors un entier, car par définition de la factorielle: 

q\ = q{q-\){q-2)..2-\ (2.42) 


est un entier. 


Les premiers termes du second membre de la relation antéprécédente, jusqu'au terme q\/q\=l sont aussi 
des entiers car q\hn\ se simplifie si q>m. Donc par soustraction nous trouvons : 


q\e — 


, q\ q\ q\ q\ ^ 




01 


0 ! 


1! 2! 3! q\ } 

où la série à droite devrait aussi être un entier! 


( 0 + 1 )! (0 + 2 )! 


Après simplification, le second membre de l'égalité devient: 


1 


■ + ■ 


1 


(0+1) (0 + 1H0 + 2) 


+ ... (2.44) 


(2.43) 


le premier terme de cette somme est strictement inférieur à 1/2, le deuxième inférieur à 1/4, le troisième 
inférieur à 1/8, etc. 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


72/4839 














Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

Donc, vu que chaque terme est strictement inférieur aux termes de la série harmonique suivante qui 
converge vers 1 : 


l/2+l/4+l/8+...= l (2.45) 

alors par conséquent, la série n'est pas un entier puisque étant strictement inférieure à 1. Ce qui 
constitue une contradiction! 

Ainsi, les nombres rationnels ne satisfont pas à l'expression numérique de ^ comme de e (pour citer 
seulement ces deux exemples particuliers). 

Il faut donc les compléter par l'ensemble de tous les nombres qui ne peuvent s'écrire sous forme de 
fraction (rapport d'un dividende et d'un diviseur entiers sans facteurs communs) et que nous appelons 
des "nombres irrationnels". 

2,6. NOMBRES RÉELS 

Définition: La réunion des nombres rationnels et irrationnels donne "l'ensemble des nombres réels". 
Ce que nous notons: 


Q C IR (2.46) 



Nous sommes évidemment amenés à nous poser la question si IR est dénombrable ou non. La 
démonstration est assez simple. 

Démonstration: 

Par définition, nous avons vu plus haut qu'il doit y avoir une bijection entre (Q et IR pour dire que IR 
soit dénombrable. 

Pour simplifier, nous allons montrer que l'intervalle [0,1 [ n'est alors pas dénombrable. Ceci impliquera 
bien sûr par extension que IR ne l'est pas! 

Les éléments de cet intervalle sont représentés par des suites infinies entre 0 et 9 (dans le système 
décimal): 

- Certaines de ces suites sont milles à partir d'un certain rang, d'autres non 

- Nous pouvons donc identifier [0,1 [ à l'ensemble de toutes les suites (finies ou infinies) d'entiers 
compris entre 0 et 9 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


73/4839 













Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


n°l 

*n 

*12 

*13 

*14 


*1 ? 


n°2 

*21 


*23 

*24 


*2, 


n°3 


*32 

*33 

*34 


*3 ? 


n°4 

*41 

*42 

*43 

*44 


*4, 


n°5 

*51 

*52 

*53 

*54 


*5 ? 


n°6 

*<51 

*62 

*63 

*64 


*6 ? 


















n°k 

*Jtl 

**2 

*Jt3 

**4 


**? 











Tableau: 2.2 - Identification et classement de nombres réels 


Si cet ensemble était dénombrable, nous pourrions classer ces suites (avec une première, une deuxième, 
etc.). Ainsi, la suite ... serait classée première et ainsi de suite... comme le propose le 

tableau ci-dessus. 

Nous pourrions alors modifier cette matrice infinie de la manière suivante: à chaque élément de la 
diagonale, rajouter 1, selon la règle: 0+1=1, 1+1=2, 8+1=9 et 9+1=0 


n°l 

*n 

+ 1 

*12 

*13 

*14 


*1 ? 


n°2 

*21 

*22 

+ 1 

*23 

*24 


*2, 


n°3 

*31 

*32 

*33 

+ 1 

*34 


*3 ? 


n°4 

*41 

*42 

*43 

*44 

+ 1 


*4, 


n°5 

*51 

*52 

*53 

*54 


*5 ? 


n°6 

*61 

*62 

*63 

*64 


*6 ? 


















n°k 

*Jtl 

*Jt2 

*Jt3 

*JW 


**? 








... 



Tableau: 2.3 - Identification et classement de nombres réels 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


74/4839 








































Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

Alors considérons la suite infinie qui se trouve sur la diagonale: 

- Elle ne peut être égale à la première car elle s'en distingue au moins par le premier élément 

- Elle ne peut être égale à la deuxième car elle s'en distingue au moins par le deuxième élément 

- Elle ne peut être égale à la troisième car elle s'en distingue au moins par le troisième élément 

et ainsi de suite... Elle ne peut donc être égale à aucune des suites contenues dans ce tableau! 

Donc, quel que soit le classement choisi des suites infinies de 0...9, il y en a toujours une qui échappe à 
ce classement! C'est donc qu'il est impossible de les numéroter... tout simplement parce qu'elles ne 
forment pas un ensemble dénombrable. 


□C.Q.F.D. 

La technique qui nous a permis d'arriver à ce résultat est connue sous le nom de "procédé diagonal de 
Cantor" (car similaire à celle utilisée pour l'équipotence entre ensemble naturel et rationnel) et 
l'ensemble des nombres réels est dit avoir "la puissance du continu" de par le fait qu'il est 
indénombrable. 

r~ ^ 

Remarque: Nous supposerons intuitif pour le lecteur que tout nombre réel peut être approché 
infiniment près par un nombre rationnel (pour les nombres irrationnels il suffit de s'arrêter à un 
nombre de décimales données et d'en trouver le rationnel correspondant). Les mathématiciens 
disent alors que Q est "dense" dans IR et notent cela: 

Q = IR (2.47) 


\_ J 

2.6.1. NOMBRES TRANSFINIS 

Nous nous retrouvons donc avec un "infini" des nombres réels qui est différent de celui des nombres 
naturels. Cantor osa alors ce que personne n'avait osé depuis Aristote: la suite des entiers positifs est 
infinie, l'ensemble N , est donc un ensemble qui a une infinité dénombrable d'éléments, alors il affirma 
que le cardinal (cf. chapitre de Théorie Des Ensembles) de cet ensemble était un nombre qui existait 
comme tel sans que l'on utilise le symbole fourre tout " œ", il le nota: 

bs 0 =Card(N) (2.48) 

Ce symbole est la première lettre de l'alphabet hébreu, qui se prononce "aleph zéro". Cantor allait 
appeler ce nombre étrange, un nombre "transfini". 

L'acte décisif est d'affirmer qu'il y a, après le fini, un transfini, c'est-à-dire une échelle illimitée de 
modes déterminés qui par nature sont infinis, et qui cependant peuvent être précisés, tout comme le 
fini, par des nombres déterminés, bien définis et distinguables les uns des autres ! ! 

Après ce premier coup d'audace allant à l'encontre de la plupart des idées reçues depuis plus de deux 
mille ans, Cantor allait poursuivre sur sa lancée et établir des règles de calcul, paradoxales à première 
vue, sur les nombres transfinis. Ces règles se basaient, comme nous l'avons précisé tout à l'heure, sur le 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


75/4839 










Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

fait que deux ensembles infinis sont équivalents s'il existe une bijection entre les deux ensembles. 

Ainsi, nous pouvons facilement montrer que l'infini des nombres pairs est équivalent à l'infini des 
nombres entiers: pour cela, il suffit de montrer qu'à chaque nombre entier, nous pouvons associer un 
nombre pair, son double, et inversement. 

Ainsi, même si les nombres pairs sont inclus dans l'ensemble des nombres entiers, il y en a une infinité 
K 0 égaux, les deux ensembles sont donc équipotents. En affirmant qu'un ensemble peut être égal à une 

de ses parties, Cantor va à l'encontre ce qui semblait être une évidence pour Aristote et Euclide: 
l'ensemble de tous les ensembles est infini ! Cela va ébranler la totalité des mathématiques et va amener 
à l'axiomatisation de Zermelo-Fraenkel que nous verrons dans le chapitre de Théorie Des Ensembles. 

A partir de ce qui précède, Cantor établit les règles de calculs suivants sur les cardinaux: 

K 0 +1 = K 0 , W 0 +K 0 =^ ( 2 - 49 ) 

À première vue ces règles semblent non intuitives mais en fait elles le sont bien! En effet, Cantor définit 
l'addition de deux nombres transfinis comme le cardinal de l'union disjointe des ensembles 
correspondants. 

Exemples: 

El. En notant donc K 0 le cardinal de N nous avons K 0 + qui est équivalent à dire que nous 
sommons le cardinal de N union disjointe N . Or N union disjointe N est équipotent à N donc 
W 0 + K 0 = (il suffit pour s'en convaincre de prendre l'ensemble des entiers pairs et impairs tout deux 
dénombrables dont l'union disjointe est dénombrable). 

E2. Autre exemple trivial: K 0 +1 correspond au cardinal de l'ensemble N union un point. Ce dernier 
ensemble est encore équipotent à N donc K 0 +1 = . 

Nous verrons également lors de notre étude du chapitre de Théorie Des Ensembles que le concept de 
produit cartésien de deux ensembles dénombrables est tel que nous ayons: 

Card (N x N) = CW(N 2 ) = [CW(N)] 2 (2.50) 


et donc: 

K 2 =K 0 (2.51) 

De même (cf. chapitre de Théorie Des Ensembles), puisque z = Z + u Z“ nous avons: 

«0 + «o = «o ( 2 - 52 > 

et en identifiant Q à Z xZ (rapport d'un numérateur sur un dénominateur), nous avons 
immédiatement: 

K 0 x rç, = ( K 0 j 3 = K 0 (2.53) 

Nous pouvons d'ailleurs démontrer un énoncé intéressant: si nous considérons le cardinal de l'ensemble 

[Vincent ISOZ] | http://www.sciences.ch] | Page: 


76/4839 






Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

de tous les cardinaux, il est nécessairement plus grand que tous les cardinaux, y compris lui-même (il 
vaut mieux avoir lu le chapitre de Théorie Des Ensembles au préalable)! En d'autres termes: le cardinal 
de l'ensemble de tous les ensembles de A est plus grand que le cardinal de A lui-même. 

Ceci implique qu'il n'existe aucun ensemble qui contient tous les ensembles puisqu'il en existe toujours 
un qui est plus grand (c'est une forme équivalente du fameux ancien paradoxe de Cantor). 

Dans un langage technique cela revient à considérer un ensemble non vide A et alors d'énoncer que: 

Card(A) < Card > P(A) < (2.54) 

où V(A) est l'ensemble des parties de A (voir le chapitre de Théorie des Ensembles pour le calcul 
général du cardinal de l'ensemble des parties d'un ensemble dénombrable). 

C'est-à-dire par définition de la relation d'ordre < (strictement inférieur), qu'il suffit de montrer qu'il 
n'existe pas d'application surjective / : A —> 'P(A '), en d'autres termes qu'à chaque élément de 
l'ensemble des parties de A il ne correspond pas au moins une pré-image dans A. 

r \ 

Remarque: P (N) est par exemple constitué de l'ensemble des nombres impairs, pairs, premiers, et 
l'ensemble des naturels, ainsi que l'ensemble vide lui-même, etc. P (N) est donc l'ensemble de 

toutes les "patates" (pour emprunter le vocabulaire de la petite école...) possibles qui forment N . 

___ / 

Démonstration (par l'absurde): 

L'idée maintenant est de supposer que nous pouvons numéroter chacune des patates de V(A) avec au 
moins un élément de A (imaginez cela avec N ou allez voir l'exemple dans le chapitre de Théorie Des 
Ensembles). En d'autres termes cela revient à supposer que / : A —> V(A) est surjective et considérons 
un sous-ensemble E de A tel que: 


E = | x e A | /(x) | (2.55) 

c'est-à-dire l'ensemble d'éléments x de A qui n'appartiennent pas à l'ensemble numéro x (l'élément x 
n'appartient pas à la patate qu'il numérote... en d'autres termes). 

Or, si / est surjective il doit alors exister aussi un y e A pour ce sous-ensemble E tel que: 

/(y) = E = (ie A\ x$ /(x)} (2.56) 

puisque E est aussi une partie de A. 

Si f (y) = E alors y <$. f (y ) mais de par la définition de E , y e E et nous avons donc une absurdité de 
par l'hypothèse de la surjectivité! 


□C.Q.F.D. 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


77/4839 











Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

2,7. NOMBRES COMPLEXES 

Inventés au 16ème siècle entre autres par Jérôme Cardan et Rafaello Bombelli, ces nombres permettent 
de résoudre des problèmes n'ayant pas de solutions dans IR ainsi que de formaliser mathématiquement 
certaines transformations dans le plan telles que la rotation, la similitude, la translation, etc. Pour les 
physiciens, les nombres complexes constituent surtout un moyen très commode de simplifier les 
notations. Il est ainsi très difficile d'étudier les phénomènes ondulatoires, la relativité générale ou la 
mécanique quantique sans recourir aux nombres et expressions complexes. 

Il existe plusieurs manières de construire les nombres complexes. La première est typique de la 
construction telle que les mathématiciens en ont l'habitude dans le cadre de la théorie des ensembles. Ils 
définissent un couple de nombres réels et définissent des opérations entre ces couples pour arriver enfin 
à une signification du concept de nombre complexe. La deuxième est moins rigoureuse mais son 
approche est plus simple et consiste à définir le nombre imaginaire pur unitaire i et ensuite de construire 
les opérations arithmétiques à partir de sa définition. Nous allons opter pour cette deuxième méthode. 

Définitions: 


DI. Nous définissons le "nombre imaginaire unitaire pur" que nous notons i par la propriété suivante: 


i 2 = -1 i = J -ï 


D2. Un "nombre complexe" est un couple d'un nombre réel a et d'un nombre imaginaire ib et s'écrit 
généralement sous la forme suivante: 


z = a+ib (2.58) 


a et b étant des nombres appartenant à IR . 

Nous notons l'ensemble des nombres complexes <C et avons donc par construction: 

IR C C (2.59) 


Ci 

Remarque: L'ensemble (C est identifié au plan euclidien orienté E (cf. chapitre de Calcul Vectoriel) 
grâce au choix d'une base orthonormée directe (nous obtenons ainsi le "plan d'Argand-Cauchy" ou 
plus communément "plan de Gauss" que nous verrons un peu plus loin). 

V___ J 

L'ensemble des nombres complexes qui constitue un corps (cf. chapitre de Théorie Des Ensembles), et 
noté <C, est défini (de manière simple pour commencer) dans la notation de la théorie des ensembles 
par: 


C = (z = (x + ï ■ - y)|x, i y e IR} 


(2.60) 


En d'autres termes nous disons que le corps C est le corps IR auquel nous avons "adjoint" le nombre 
imaginaire i. Ce qui se note formellement: 


ffi[î] (2.61) 


L'addition et la multiplication de nombres complexes sont des opérations internes à l'ensemble des 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


78/4839 















Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


complexes (nous reviendrons beaucoup plus en détail sur certaines propriétés des nombres complexes 
dans le chapitre traitant de la Théorie Des Ensembles) et définies par: 


Z l +Z 2 = (*1 + * 2 ) + ïOl +J 2 ) 

-yy2) + KWi + ^ 1 ) 

La "partie réelle" de z est traditionnellement notée: 

'ft(z) = X (2.63) 

La "partie imaginaire" de z est traditionnellement notée: 


(2.62) 


0 : (z) =y (2.64) 

Le "conjugué" ou "conjugaison" de z est défini par: 

z = x - iy (2.65) 

et est aussi parfois noté z * (en particulier en physique quantique dans certains ouvrages!). 

A partir d'un complexe et de son conjugué, il est possible de trouver ses parties réelles et imaginaires. 
Ce sont les relations évidentes suivantes: 


9t( z) = et Q(z) = — (2.66) 

2 2î 

Le "module" de z (ou "norme") représente la longueur par rapport au centre du plan de Gauss (voir un 
peu plus bas ce qu'est le plan de Gauss) et est simplement calculé avec l'aide du théorème de 
Pythagore: 


|= + J 2 = "Jz ~z 


(2.67) 


et est donc toujours un nombre positif ou nul. 


Remarque: La notation |z| pour le module n'est pas innocente puisque \z\ coïncide avec la valeur 
absolue de z lorsque z est réel. 


La division entre deux complexes se calcule comme (le dénominateur étant évidemment non nul): 


Zl _ *1 +Ï >1 _ *1 +Ï >1 *3 ~iy 2 _ 1 *1*2 + ' ~i ' *1^3 "*3^1 1 


z 2 z 2 +iy 2 z 2 +iy 2 x 2 -iy 2 
L'inverse d'un complexe se calculant de façon similaire: 

1 _ (x-iy) _ x~iy x~iy 


3.2 

*3 + ^3 


( 2 . 68 ) 


-J ■ 


x + iy (x + iy)(x-iy) x 2 -(iy) 2 x 2 + y 2 x 2 + y 2 x 2 + y 2 


(2.69) 


Nous pouvons aussi énumérer 8 importantes propriétés du module et du conjugué complexe: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


79/4839 
























Vincent ISOZ [v3.0-2013] 


PI. Nous affirmons que: 


Démonstration: 


[SCIENCES.CH] 


\z\ = 0 z = 0 (2.70) 


Par définition du module |^| = ^jx 2 + y 2 , pour que la somme r? + y 2 soit nulle, la condition nécessaire 
est que: 


*=7 = 0 (2.71) 


P2. Nous affirmons que: 


\z\ - \-z\ - \z (2.72) 


Démonstration: 


kl = + 7 2 = Vc-*) 2 + c- /f = M = ■sj(x ) 2 + c -ÿf = kl 


P3. Nous affirmons que: 


|îfî(z)| < kl avec égalité si et seulement si z est réel 
toUkl avec égalité si et seulement si z est imaginaire 


(2.74) 


Démonstration: 


Les deux inégalités ci-dessus peuvent s'écrire: 

k| < \ja 2 + h : 

|à| < -Jâ 2 +b 2 

donc équivalent respectivement à: 


(2.75) 


a' 2 < a 2 +b 2 
b 2 < a 2 +b 2 


(2.76) 


qui sont triviales. La suite est alors triviale... 


nC.Q.F.D. 


□C.Q.F.D. 


□C.Q.F.D. 


P4. Nous avons: 


Vfzj.z^eCxC ki^hkilkal ( 2 - 77 ) 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


80/4839 













Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

et si: 


* 0, 




(2.78) 


Démonstrations: 


2 _ _ _ _ 2 2 

k z 2 I = ( z l z 2 X z l z 2 ) = ( z l z 2j( z l z 2 ) = ( Z 1 Z 1 ) ( Z 2 Z 2 ) = \ Z 1 \ \ z 2 | 

=> 1 = kilkal 


(nous démontrerons un peu plus bas en toute généralité que z 1 z 2 = z 1 z 2 ) et: 


= ^l4 = 
Z 2 ^2 


h] 

M 


(2.80) 


nC.Q.F.D. 


P5. Nous affirmons (à nouveau...) que: 

|z| 2 = z ’z (2.81) 

Démonstration: 

\4 = 4 x2 + y 2À = ( x + - iy) = -ixy +iyx + y 2 = z? +y 2 = z ■ z ( 2 - 82 > 

□C.Q.F.D. 


P6. Nous affirmons que: 


Vz, z 'z =z, z + z' = z + z', z'z l = z'z' 


(2.83) 


Démonstrations: 


z = x+iy = x-iy = x+iy=z 


et: 


z + z' = (x 1 +ï>j) + (x 2 +iy 2 ) = +^) + ï0 1 +y 2 ) = (x 1 + x 2 ) -i^+y^ 

= (*! -îJi) + (*2 -jy a ) =z + z' 


et: 


zz'={x 1 + + iy 2 ) = -7i^ 2 ) + i(Va + JV^) = ( Va “ Va) “*CVa + Va) 

= (*i -îJi)C^2 -iy 2 ) = zz ' 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


81/4839 


























Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

□C.Q.F.D. 


C ^ 

Remarques: 

RL En des termes mathématiques, la première démonstration permet de montrer que la conjugaison 
complexe est ce que l'on appelle "involutive" (dans le sens qu'elle ne fait rien évoluer...). 

R2. En des termes tout aussi mathématiques (ce n'est que du vocabulaire!), la deuxième 
démonstration montre que la conjugaison de la somme de deux nombres complexes est ce que nous 
appelons un "automorphisme du groupe" ■ (C, + ■ (cf. chapitre de Théorie Des Ensembles). 

R3. Encore une fois, pour le vocabulaire..., la troisième démonstration montre que la conjugaison du 
produit de deux nombres complexes est ce que nous appelons un "automorphisme du corps" 

i <C, +,xi (cf. chapitre de Théorie Des Ensembles). 


V 


J 


P7. Nous affirmons que pour z différent de zéro: 


, Z 'J z ' 

Nous nous restreindrons à la démonstration de la seconde relation qui est un cas général de la première 
(pour z = 1). 


Démonstration: 


{z\ _ x l +iy l _ + iv 1 x 2 ~iy 3 _ + y^ 2 ) + i(Ti*a ~T 3 *i) 

\z ) x 2 + iy 2 x 2 +iy 2 x 2 ~iy 2 x 2 + y 2 

_ Oi* a + y^ 2 ) _ (xiXj +y 1 y 2 ) + i(y 2 x 1 ~y^ 2 ) 

~ — t~~2 — 1 — t~~2 —"- t~~2 - 

x 2 + y 2 x 2 + y 2 x 2 + Ta 

= (*i ~lVi)u. +j> 2 ) _ *i ~ ; Ti x 2 +? Ta _ z 
4 + >a *2 _ï Ta x 2 +ï >a z' 


nC.Q.F.D. 


P8. Nous avons: 


\ Z 1 + z 2 f = \ z l f + 23Î ( z l z 2 ) + \ z 2 f (2.89) 


Démonstration: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


82/4839 




























Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


K + *2 f = 1*1 + ! 7l + *2 + *72 | 2 = |Ul + *2 1 + ï 1 7l +72 )f 


2 2 2 2 
= |JÎ *1 + *2 1 + ' 7i +72 1 I = 1 *1 + x 2 J + 1 7i +72 ) 

= xf +2x x x 2 + x 2 +7i 2 + 2 7 i72 +72 = 1 4 +7? ) + 2 ( *i* 2 +yjv 2 1 +' x 2 + v 2 ) 
= |zj| + 2SR( ( + jyj ) ( x 2 - iy 2 ) ) + |z 2 1 =|^i| + 2SRi z l z 2 i + |z 2 \ 


(2.90) 


□C.Q.F.D. 


P9. Nous avons: 


k + ^aU hl + l z al 


pour tous complexes z x ,z 2 (rigoureusement non nuis car sinon le concept d'argument du nombre 
complexe que nous verrons plus loin est alors indéterminé). De plus l'égalité a lieu si et seulement si z 1 
et z 2 sont colinéaires (les vecteurs sont "sur la même droite") et de même sens, autrement dit.... s'il 
existe A e M + tel que z l = Az 2 . 


Démonstration: 

K + f = kif + 2< ft( z i z i ) + hf - Kl 2 + 2 


z 1 z 2 


+ \z 2 \ 2 =(|z 1 |+|z 2 |) 2 (2.92) 


Cette inégalité peut ne pas paraître évidente à tout le monde alors développons un peu et supposons-la 
vraie: 


K +z sf ^(kil + h[f 

yj ( x i + ^) 2 + (7i +7 2 ) 2 ^[44 + 7i + + 7a ) 

(*1 + ) + (7i + 7a ) -(*i + 7i ) + + Vj i/x 2 ~ 7a + ( 4 + 7a ) 

Xj + 2x 1 x 2 + x 2 + /j + 2y 1 7a + 7a -(*1 + 7i ) + 2 \j x i + 7i -y/^a + 7a + (*a + 7a ) 
Après simplification: 


(2.93) 


*i*a + 7i7a ^ + V*a + 7a 

(xix 2 + 7i7a) 2 -( + 7 ?)[A + 7a 2 ) (2 ' 94) 

î 

22 ,^ , 22 / 22 , 22 , 22,22 

^1^2 + + y \ y 2 -^1^2 + y \ ^2 + ^i^2 


et encore après simplification: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


83/4839 


















Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


2 ^'i^vi <*1^2 + y'i A. 

0 i AA - 2x 1 x 2 y x y 2 + yl Vj (2 ' 95) 

0<(^ 2 ~y^ 2 Ÿ 

donc comme la parenthèse au carré est forcément positive ou nulle il s'ensuit: 

-y^i? ( 2 . 96 ) 

Cette dernière relation démontre donc que l'inégalité est vraie. 


nC.Q.F.D. 

c~ -^ 

Remarque: Il existe une forme plus générale de cette inégalité appelée "inégalité de Minkowski" 
présentée dans le chapitre de Calcul Vectoriel (les nombres complexes peuvent effectivement 
s'écrire sous la forme de vecteurs comme nous allons le voir de suite). 

___ ) 

2.7.1. INTERPRÉTATION GÉOMÉTRIQUE 

Nous pouvons aussi représenter un nombre complexe a+ib ou a~ïb dans un plan délimité par deux 
axes (deux dimensions) de longueur infinie et orthogonaux entres eux. L'axe vertical représentant la 
partie imaginaire d'un nombre complexe et l'axe horizontal la partie réelle (voir figure ci-après). 

Il y donc bijection entre l'ensemble des nombres complexes et l'ensemble des vecteurs du plan de Gauss 
(notion d'affixe). 

Nous nommons parfois ce type de représentation "plan de Gauss": 



et nous écrivons alors: 


Aff(r) = a+ib ( 2 . 97 ) 

Nous voyons sur ce diagramme qu'un nombre complexe a donc une interprétation vectorielle (cf. 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


84/4839 




















Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


chapitre de Calcul Vectoriel) donnée par: 


z = a 


A) 


f°l 


+ 


<0; 




b = a +ib 


où la base canonique est définie telle que: 


1 = 


/i\ 


vû/ 


,! = 


r 0"' 


(2.99) 


avec: 


= Izl = 4a +b A (2-100) 


Ainsi, 


A' 








est le vecteur de la 



V 


r 0 1 


V 

v = xe-L + ye 2 = x 

0 

\ J 

+ 7 

1 

Il J 




est le vecteur de la base unitaire porté par l'axe horizontal IR et 
base unitaire porté par l'axe imaginaire M; et r est le module (la norme) positif ou nul. 

Ceci est à comparer avec les vecteurs de (cf. chapitre de Calcul Vectoriel): 

( 2 . 101 ) 

U I 111 IV I 

\ / \ i V / 

avec: 

( 2 . 102 ) 

ce qui fait que nous pouvons identifier le plan complexe avec le plan euclidien. 

Par ailleurs, les définitions du cosinus et sinus (cf. chapitre de Trigonométrie) nous donnent: 

a=rcos(J? b =rsm<p (2.103) 

Finalement: 


(2.104) 



A in si: 


z = a +ib = r cos <p+ irsin g>= r{cos<p + i sin ç>) = r • cisç> (2.105) 


complexe qui est toujours égal à lui-même modulo 2 x de par les propriétés des fonctions 
trigonométriques : 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


85/4839 
































Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


z = /'(cos (p + i sin <p) = r < cos((p + k2n) + i sin((p + k2n) < 


(2.106) 


avec isN et où (P est appelé "l'argument de z" et est noté traditionnellement: 

arg(z) (2.107) 

Les propriétés du cosinus et du sinus (cf. chapitre de Trigonométrie) nous amènent directement à écrire 
pour l'argument: 


arg(z) = -arg(z) et arg(-z) = arg(z) + JT (2.108) 

Nous démontrons entre autres avec les séries de Taylor (cf. chapitre des Suites Et Séries) que: 

$ & q? k 

cos <p = 1 - — + — + (-1)* —— + ... (2.109) 

2! 4! (2k) ! 


et: 


$ g? j (p 2 * - * 1 

sin (p = <p~ — + —-....+ (-l) — - + ... (2.110) 

' ' 3! 5! (2A: + 1) ! 


dont la somme est semblable à: 


e 9 =\ + (p + ^- + ^-+ +^+ ( 2 . 111 ) 

' 2! 3! k\ 


mais par contre parfaitement identique au développement de Taylor de g* : 


e 19 = 1 +i<p- - i — -... + (j)* —— + ... = cos <p + i sin (p 

' 2! 3! k\ 


Donc finalement, nous pouvons écrire: 


z = /"(cos çp + i sin (p) = r • e llf 


(2.113) 


relation nommée "formule d'Euler". 

Grâce à la forme exponentielle d'un nombre complexe, très fréquemment utilisée dans de nombreux 
domaines de la physique et de l'ingénierie, nous pouvons très facilement tirer des relations telles que 
(cis est une vieille notation qui est l'abréviation du cos i sin se trouvant dans la parenthèse): 

z = /"(cos g> + i sin (p) = rcisç = re lsf 

Zj = /i(cos(^ +î sin(q) = r-ydsg^ = /je^ (2.114) 

z 2 =/" 2 (cos^ +isin^) =r 2 cisç± = r 2 e lf » 

et en supposant connues les relations trigonométriques de bases (cf. chapitre de Trigonométrie) nous 
avons les relations suivantes pour la multiplication de deux nombres complexes: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


86/4839 










Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


z i' z 2 =n'^[ cos (<q + ^) + *sm(^ + ft)] = + ^) 


= r 1 e lm r^s i<ft = r l r 2 e 1< '* ,+ ^ > 


(2.115) 


dès lors: 

ar g( z i ' z 2 ) = aig(z x ) + arg(z 2 ) (2.116) 

et donc si n est un entier positif: 

arg (z" ) = « arg(z) (2.117) 

Pour le module de la multiplication (nous changeons de notation pour la lisibilité): 

= rr 1 = Izj I |z 2 1 (2.118) 


z l z 2\ = 


iq? i iaf 

rs^r 


rr e 




d'où: 


Z™ =1 zP (2.119) 


Pour la division de deux nombres complexes: 


Zi _ rj 


— = —[cos(fl - <&) +i sin(^ - <^)] = ±cis(q{ - 


z 2 r 2 

r ^ r 

= _!£__ = 

r 2 e*" 1 r 2 


Le module de leur division vient alors immédiatement: 


( 2 . 120 ) 


= 7-7 (2.121) 


dès lors nous avons pour l'argument: 


arg 


ainsi il vient immédiatement: 


-1 






f 

Z 1 

= arg 

re 

l 2p' 

r & ■ 

v / 

= arg 


z 2 



J' 


= <p~ çp' = arg < z 1 ' - arg < z 2 1 (2.122) 


, 1 


1 


argi z 1 i = arg re v i J = arg = ~<p = - arg(z) (2.123) 

Pour la mise en puissance d'un nombre complexe (ou la racine): 

z K = r"V Msf = r K [cos(?nç>) +i sin (fn<p)\ = r K cis(m<p) (2.124) 
ce qui nous donne immédiatement un résultat déjà mentionné plus haut: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


87/4839 
























Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

|z M |=|zf (2.125) 

et pour l'argument: 

arg( z m ) = arg 1 1 re l<p \ j = arg i r m e iipm ] ■ <pm= m arg(z) (2.126) 

Dans le cas où nous avons un module unité tel que z = cos((p) + i sm(ç?) nous avons alors la relation: 

(cos Ç>+i sin) m = = cos (m(J?) +î sin (m<pj (2.127) 

appelée "formule de De Moivre". 

Pour le logarithme népérien d'un nombre complexe, nous avons trivialement la relation suivante sur 
laquelle nous reviendrons dans le chapitre d'Analyse Complexe: 

ln(z) = lnjVe^) = ln(>) +i<p (2.128) 

où ln( z ) est souvent dans le cas complexe écrit Log( z ) avec un "L" majuscule. 

Toutes les relations précédentes pourraient bien sûr être obtenues avec la forme trigonométrique des 
nombres complexes mais nécessiteraient alors quelques lignes supplémentaires de développements. 

C ' ^ 

Remarque: Une variation sinusoïdale / (i) = rsm(æt) peut être représentée comme la projection 
(cf. chapitre de Trigonométrie) sur l'axe vertical y (axe des imaginaires de l'ensemble C) d'un 
vecteur ? tournant à vitesse angulaire (S autour de l'origine dans le plan xOy: 



Figure: 2.6 - Représentation d’un vecteur de Fresnel 


Un tel vecteur tournant s'appelle "vecteur de Fresnel" et peut très bien être interprété comme la 
partie imaginaire d'un nombre complexe donné par: 

r = Sft(F) + = r(cos(^) +îsin(iZtf)) = re 11 * = re 19 (2.129) 

Nous retrouverons les vecteurs tournants de façon explicite lors de notre étude de la mécanique 
ondulatoire et optique géométrique (dans le cadre de la diffraction). 

C_ J 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


88/4839 
















Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

2.7.2. TRANSFORMATIONS DANS LE PLAN 

Il est habituel de représenter les nombres réels comme points d'une droite graduée. Les opérations 
algébriques y ont leur interprétation géométrique: l'addition est une translation, la multiplication une 
homothétie centrée à l'origine. 

En particulier nous pouvons parler de la "racine carrée d'une transformation". Une translation 
d'amplitude a peut être obtenue comme l'itération d'une translation d'amplitude al 2. De même une 
homothétie de rapport a peut être obtenue comme l'itérée d'une homothétie de rapport ^. En 

particulier une homothétie de rapport 9 est la composée de deux homothéties de rapport 3 ( ou -3). 

La racine carrée prend alors un sens géométrique. Mais qu'en est-il de la racine carrée de nombres 
négatifs? En particulier de la racine carrée de -1? 

Une homothétie de rapport -1 peut être vue comme une symétrie par rapport à l'origine. Toutefois si 
nous voulons voir cette transformation d'une manière continue, force nous est de placer la droite dans 
un plan. Dès lors une homothétie de rapport -1 peut être vue comme une rotation de n radians autour 
de l'origine. 

Du coup, le problème de la racine carrée négative se simplifie. En effet, il n'est guère difficile de 
décomposer une rotation de n radians en deux transformations: nous pouvons répéter soit une rotation 
de ni 2 soit une rotation de -ni 2- L'image de 1 sera la racine carrée de -1 et i est située sur une 
perpendiculaire à l'origine à une distance 1 soit vers le haut soit vers le bas. 

Ayant réussi à positionner le nombre i il n'est plus guère difficile de disposer les autres nombres 
complexes dans un plan de Gauss. Nous pouvons ainsi associer à 2i le produit de l'homothétie (cf. 
chapitre de Géométrie Euclidienne) de rapport 2 par la rotation de centre O et d'angle ni 2, soit une 
similitude centrée à l'origine. C'est ce que nous allons nous efforcer à montrer maintenant. 

Soient: 


z \ = *1 + ^l = &e ia ,Z2 = + ^2 (2.130) 


et Jfc € N. 

Nous avons les propriétés de transformations géométriques suivantes pour les nombres complexes (voir 
le chapitre de Trigonométrie pour les propriétés du sinus et cosinus) que nous pouvons joyeusement 
combiner selon notre bon vouloir: 

Pl. La multiplication de z r par un réel A dans le plan de Gauss correspond (trivial) à une homothétie 
(agrandissement) de centre O (l'intersection des axes imaginaires et réels), de rapport A . 

Démonstration: 


Àz-\ = [Â-a'\e ia (2.131) 


□C.Q.F.D. 


P2. La multiplication de z x par un nombre complexe de module unitaire: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


89/4839 







Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


z 0 =x 0 + = cos œ + i sin a> = s ia (2.132) 

correspond à une rotation de centre O et d'angle du complexe z l . 

Démonstration: 

2'û] 2LÏ z'f ff+flQ 

ZqZj = e ae = ae K ; 


nC.Q.F.D. 


Remarque: Nous voyons alors immédiatement, par exemple, que multiplier un nombre complexe 
par i (c'est-à-dire sin(dJ) = l,cos((U) = 0 ) correspond à une rotation de ,t / 2 ■ 

__ J 

Il est intéressant d'observer que sous forme vectorielle la rotation de centre O de z l par z 0 peut s'écrire 
à l'aide de la matrice suivante: 


*b -yo 
7o *0 


(2.134) 


Démonstration: 

Nous savons que z 0 z 1 est une rotation de centre O et d'angle a . Il suffit de l'écrire à l'ancienne: 

z o z \ = (*o + )(*i + ! >1 ) = (*o*i -yayi) + i (* 0^1 + 7o*i ) (2- 135 > 

ce qui donne sous forme vectorielle: 


z o z i ~ 


\ fr, 

*o*i "Wil fO 


0 


+ i 


*0» + 7o*l 


(2.136) 


donc l'application linéaire est équivalente à: 


'*0 

-yo' 

> 

*i 


r *ü*i 

/O 




/o7l + 7o*i i 


(2.137) 


ou encore (nous retombons sur la matrice de rotation dans le plan que nous avons dans le chapitre de 
Géométrie Euclidienne ce qui est un résultat remarquable!) en utilisant: 

z = r(cosç} + i sin ç>) = r ( cos(ç> + k2?t) +i sin((p+ k2n) < (2.138) 

dans le cas particulier et arbitraire où r serait unitaire (afin d'avoir une rotation pure!): 

z = cos((p+£2jt) + î sin((p+ £2rr) = (2.139) 

nous avons immédiatement (nous avons repris les notations de l'angle tel que nous l'avons dans le 
chapitre de Géométrie): 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


90/4839 

























Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


*0 

-yo 

V 


.J'o 

^ . 

,/i. 



cos■ -sm ' 

sim Q i cos i Cù i 


/■K \ / 


“ Wi 


\ / 


\ 


Ul J Uo^i + « 

Remarquons que la matrice de rotation peut aussi s'écrire sous la forme : 


cosfiïJ)^ - sinf^X^j 
^cosfiîJ)^ + s m ( oU) Aq 


(2.140) 


cos((2f) -sin(<2f) 
sin(iïJ) cos(iïJ) 


cos(®) 


1 0 
0 1 


+ sin(<2f) 


0 - 1 ' 

1 0 


cos(£fl) ■ / + sin(^) ■ J (2.141) 


de même : 



"V 


'1 

0' 


'0 -1' 

/o 

*0 . 

= *0 

0 

1 

+ 7o 

1 0 


= x 0 'I + y 0 ‘J (2.142) 


□C.Q.F.D. 

Ainsi nous remarquons que ces matrices de rotation ne sont pas que des applications mais sont des 
nombres complexes aussi (bon c'était évident dès le début mais fallait le montrer de manière esthétique 
et simple). 

Ainsi, nous avons pour habitude de poser que : 


'1 

0 " 


'0 - 1 " 

_0 

1 _ 


.1 °_ 


(2.143) 


ou avec une autre notation fréquente en alègbre linéaire: 


'1 

0 " 


'0 - 1 " 

_0 

1 _ 


_1 0 _ 


(2.144) 


Le corps des nombres complexes est donc isomorphe au corps des matrices réelles carrées de 
dimension 2 du type: 


~yo 

>fj *0 


(2.145) 


C'est un résultat que nous réutiliserons de nombreuses fois dans divers chapitres de ce site pour des 
études particulières en algèbre, géométrie et en physique quantique relativiste. 

P3. La multiplication de deux complexes correspond à une homothétie ajoutée à une rotation. En 
d'autres termes, d'une "similitude directe". 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


91/4839 









































Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

Démonstration: 

ZjZ 2 = as^be 1 ^ = ■ qb \e^—^ 

il s'agit donc bien d'une similitude de rapport b et d'angle fi. 


□C.Q.RD. 


Au contraire, l'opération suivante: 

Z\Z 2 = ae^be -1 ^ = ' ab 

sera appelée une "similitude linéaire rétrograde". 

Par ailleurs, il en retourne trivialement la relation déjà connue suivante: 

= arg(*i) + argC^) ( 2 - 148 ) 

- 

Remarques: 

RI. La somme de deux nombres z x + z 2 complexes ne pouvant avoir une écriture mathématique 

simplifiée sous quelque forme que ce soit, nous disons alors que la somme équivaut à une 
"translation d'amplitude". 

R2. La combinaison d'une similitude linéaire (multiplication de deux nombres complexes) directe et 
d'une translation d'amplitude (sommation par un troisième nombre complexe) correspond à ce que 
nous appelons une "similitude linéaire directe". 

s*_ J 

P4. Le conjugué d'un nombre complexe est géométriquement son symétrique par rapport à l'axe IR tel 
que: 

Zj = Xj - iyj = r ■ cos a - i sin a < = r > cos(-o:) + i sin(-o:) ) = re !ûr (2.149) 
sans oublier que: 

cos((p) = cos((p + k2n), sin((p) = sin((p + £2zr) (2.150) 

Ce qui nous donne un résultat déjà connu: 

arg(z i) = “ arg(zi) (2.151) 

D'où nous pouvons tirer la propriété suivante: 

■ cos((p + n) + i sin((P+ n )< = r< - cos (ç>) -i sin((p) i = -r\ cos (ç>) + i sin((p) < = ~z l (2.152) 

d'où: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


92/4839 











Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

arg^) + 7T = arg^) (2.153) 

P5. La négation du conjugué d'un nombre complexe est géométriquement son symétrique par rapport à 
l'axe des imaginaires tel que: 

-zj = -. 1 ) + iy\ = r i - cos a + i sin a > = r < cos(zr ± a:) + i sin(cï) < (2.154) 

( -\ 

Remarques: 

RI. La combinaison de P4, P5 est appelée une "similitude rétrograde". 

R2. L'opération géométrique qui consiste à prendre l'inverse du conjugué d'un nombre complexe 
(soit j -1 ) est appelée une "inversion de pôle". 

V_ ) 

P6. La rotation de centre c et d'angle (P est donnée par: 

c + e iÇf (z : -c) (2.155) 


Explications: 

Le complexe c donne un point dans le plan de Gauss qui sera le centre de rotation. La différence z 1 ~c 
donne le rayon r choisi. La multiplication par est la rotation du rayon par rapport à l'origine du plan 
de Gauss dans le sens inverse des aiguilles d'une montre. Finalement, l'addition par c la translation 
nécessaire pour ramener le rayon r tourné à l'origine du centre c. Ce qui donne schématiquement: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


93/4839 














Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 



-i -i o 


Figure: 2.7 - Représentation de la rotation complexe 

P7. Sur la même idée, nous obtenons une homothétie de centre c, de rapport Ji par l'opération: 


c+A(z 1 ~c) (2.156) 


Explications: 

La différence Zj ~c donne toujours le rayon r et c un point dans le centre de Gauss. À(z 1 ~c ) donne 
l'homothétie du rayon par rapport à l'origine du plan de Gauss et finalement l'addition par c la 
translation nécessaire pour que l'homothétie soit vue comme étant faite de centre c. 

2,8. NOMBRES QUATERNIONS 

Appelés aussi "hypercomplexes", les nombres quatemions ont été inventés en 1843 par William Rowan 
Hamilton pour généraliser les nombres complexes. 

Définition: Un quatemion est un élément ( a,b,c,d ) e IR 4 et dont nous notons H l'ensemble qui le 
contient et que nous appelons "ensemble des quatemions". 

Un "quatemion" peut aussi bien être représenté en ligne ou en colonne tel que: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


94/4839 















Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


■ a,h,c,d ' = 


a ' 


h 

c 

d 


( 2 . 151 ) 


Nous définissons la somme de deux quatemions ( a,b,c,d) et (a\b\c\d') par: 

(i a,b,c,d ) + {a',b',c\d') = {a + a',b +b' ,c + c',d + d') (2.158) 


Il est évident (du moins nous l'espérons pour le lecteur) que ■ H, + ' est un groupe commutatif (cf. 

chapitre de Théorie Des Ensembles), d'élément neutre (0,0,0,0), l'opposé d'un élément ( a,b,c,d) étant 
(- a,-b,-c,-d) 

r -^ 

Remarque: C'est l'addition naturelle dans j? 4 vu comme IR -espace vectoriel (cf. chapitre de 
Théorie Des Ensembles). 

v_:_/ 

L'associativité se vérifie en appliquant les propriétés correspondantes des opérations sur IR . 

Nous définissons également la multiplication: 

(a,b,c,d)‘(a',b',c',d r ) (2.159) 


de deux quatemions ( a,b,c,d) et (a \b \c 'd ') par l'expression: 


aa'-bb'-cc'-dd' ï 


(ab'+ba') +(cd '-de') 
(ac '+ca')~ (bd '- db ) 
^(da '+ad') + (bc'-cb) 


(2.160) 


C'est peut-être difficile à accepter mais nous verrons un peu plus loin qu'il y a un air de famille avec les 
nombres complexes. 


Nous pouvons remarquer que la loi de multiplication n'est pas commutative. Effectivement, en prenant 
la définition de la multiplication ci-dessus, nous avons: 


( 0 , 1 , 0 , 0 ) ■ ( 0 , 0 , 1 , 0 ) = ( 0 , 0 , 0 , 1 ) 
( 0 , 0 , 1 , 0 )'( 0 , 1 , 0 , 0 ) = ( 0 , 0 , 0 ,- 1 ) 


Mais nous pouvons remarquer que: 


( 0 , 1 , 0 , 0 ) ■ ( 0 , 0 , 1 , 0 ) = -( 0 , 0 , 1 , 0 )'( 0 , 1 , 0 , 0 ) 


(2.162) 


~N 


Remarque: La loi de multiplication est distributive avec la loi d'addition mais c'est un excellent 
exemple où il faut quand même prendre garde à démontrer la distributivité à gauche et à droite, 
puisque le produit n'est pas commutatif ! 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


95/4839 



















Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


La multiplication a pour élément neutre: 


(1,0,0,0) (2.163) 


Effectivement: 


Tout élément: 


(1,0,0,0) ■ (a.b.c.d) = (a,b,c,d) ■ (1,0,0,0) = (a,b,c,d) 


(2.164) 


(a.^.^eH' =H-{(0,0,0,0)} (2.165) 


est inversible. 

En effet, si ( a,b,c,d) est un quatemion non nul, nous avons alors nécessairement: 

a 2 + b 2 + c 2 + d 2 ^0 (2-166) 

sinon les quatre nombres a, b, c, d sont de carré nul, donc tous nuis. Soit alors le quatemion 
■ ü) , ^, q , d 1 i défini par: 


a, = 


1 a 2 + b 2 + c 2 +d 2 

u - ~ b 

* a 2 + b 2 +c 2 + d 2 


(2.167) 


~c 

Cl ~â T Tb r T?T^ 


d 1 


-d 


a 2 + b 2 +c 2 +d 2 


alors en appliquant machinalement la définition de la multiplication des quatemions, nous vérifions que: 
■ a,b,c,d i 11 flj,^,^,^ ' = ' a 1 ,b 1 ,c 1 ,d 1 i ■ > a,b,c,d i = ( 1, 0,0,0 i (2.168) 


ce dernier quatemion est donc l'inverse pour la multiplication! 

Montrons maintenant (pour la culture générale) que le corps des complexes i (Ç+,x, est un sous-corps 
de ' H, +,x). 



Soit H 1 l'ensemble des quatemions de la forme (a,b, 0,0). Si H ' est non vide, et si (a,h,0,0), (a', h',0,0) 
sont des éléments de H 1 alors . H',+,x. est un corps. Effectivement: 

PI. Pour la soustraction (et donc l'addition): 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


96/4839 

















Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

(a,b, 0,0) - (ü ',b ', 0,0) = (a - a \b ~b ',0,0) e H' (2.169) 

P2. La multiplication: 

(a,b, 0,0) 1 (a \b ', 0,0) = (aa '~bb ',ab '+ ba 0,0) e H ' (2.170) 

P3. L'élément neutre: 

(1,0,0,0) e H' (2.171) 

P4. Et finalement l'inverse: 

l a! i a 2 + b 2 ),~bf i a 2 + b 2 j, 0,0 i (2.172) 


de (a,b, 0,0) est encore dans H '. 

Donc (H',+, x 1 est un sous-corps de H. Soit alors l'application: 

f <C—> H' 

f { (2.173) 

\a +ib\^ (a,b,0,0) 

f est bijective, et nous vérifions aisément que pour tous complexes z x ,z 2 , nous avons: 


/(Zi + z 2 ) =f(z 1 )+f(z 2 ) 

f(^2) = fW)f( Z 2) 

Donc / est un isomorphisme de ■ <Ç+, x i sur ■ H ', +, x i. 

Cet isomorphisme a pour intérêt (provoqué) d'identifier (C à H ' et d'écrire C c H , les lois d'addition 
et de soustraction sur H prolongeant les opérations déjà connues sur (C- 

Ainsi, par convention, nous écrirons tout élément de (a,b, 0,0) de H 1 sous la forme complexe a+ib. En 
particulier 0 est l'élément (0,0,0,0), 1 l'élément (1,0,0,0) et i l'élément (0,1,0,0). 

Nous notons par analogie et par extension j l'élément (0,0,1,0) et k l'élément (0,0,0,1). La famille 
{1 ,ij,k} forme une base de l'ensemble des quatemions vu comme un espace vectoriel sur ®, et nous 
écrirons ainsi a+bi+cj +dk le quatemion ( a,b,c,d ). 

La notation des quatemions sous forme définie ci-avant est parfaitement adaptée à l'opération de 
multiplication. Pour le produit de deux quatemions nous obtenons en développant l'expression: 

(a + bi + cj + dk) • (c '+ b'i + c 1 j + d'k) (2.175) 

16 termes que nous devons identifier à la définition d'origine de la multiplication des quatemions pour 
obtenir les relations suivantes: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


97/4839 






Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


i j = k = -j-i 
j-k = i=-k- j 
k-i = j = -ï • k 
ï 1 =f=k 2 =-l 


(2.176) 


Ce qui peut se résumer dans un tableau: 



i 

i 

j 

k 

1 

i 

i 

j 

k 

i 

i 

-i 

k 

-j 

j 

j 

-k 

-i 

i 

k 

k 

j 

-i 

-i 


Tableau: 2.4 - Multiplication des composantes d’un quaternion 

Nous pouvons constater que l'expression de la multiplication de deux quatemions ressemble en partie 
beaucoup à un produit vectoriel (noté x sur ce site) et scalaire (noté o sur ce site): 

r aa,'- hh'-cc'- dd' ^ 

{ab '+ba') + {cd de ) 

(i ac'+ ca')~ {bd db ) 

{da '+ ad') + {bccb ) 


(2.177) 


Si ce n'est pas évident (ce qui serait tout à fait compréhensible), faisons un exemple concret. 

Exemple: 

Soient deux quatemions sans partie réelle: 

p=xi+yj+zk q = x'i+y'j+z'k (2.178) 
et û,v les vecteurs de p/ de coordonnées respectives (x, y, z) et (x',/, z'). Alors le produit: 

p ■ q = (0,u) ■ (0,v) (2.179) 
est: 

p-q = (-xx 1 - yy'~ zz',yz'~ zy',~xz'+ zx',xy'~ yx 1 ) = (-ü°v,ÜXv) 

Nous pouvons aussi par curiosité nous intéresser au cas général... Soient pour cela deux quatemions: 

p = (a, u) q = (b,v) (2.180) 

Nous avons alors: 

p • q = (a + (0,u)) ■ (& + (0,v)) = ab + (0,ûv) + (0,M) + (~u ov^xy) 


(i ab - wo v,av + bu + Ü x v) 


(2.181) 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


98/4839 

















Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


Définition: Le centre du corps non-commutatif ■ H, +,x i est l'ensemble des éléments de H commutant 
pour la loi de multiplication avec tous les éléments de H. 


Nous allons montrer que le centre de i H, +,x ■ est l'ensemble des réels! 


Soit Hj le centre de ■ H, +, x ), et (x,y, z, t) un quatemion. Nous devons avoir les conditions suivantes 
qui soient satisfaites: 

Soit (x,y,z,t) e Hj alors pour tout (a,b,c,d) e. H nous cherchons: 

( x,y, z,t) ■ (a,b,c, d) = (a, b,c,d) ■ ( x, y,z,t) (2.182) 
ce qui donne en développant: 


xa-yb-zc -td = ax- by- cz - dt 
xb + ya + zd - te = ay + bx + et - dz 
xc +za- yd +tb = az + ex - bt + dy 
ta + xd +yc - zb - dx+at + bz - cy 


après simplification (la première ligne du système précédent est nulle des deux côtés de l'égalité): 

et ~ dz = 0 
bt~dy = 0 (2.184) 

bz ~ cy = 0 

la résolution de ce système, nous donne: 

y = z = t = 0 (2.185) 

Donc pour que le quatemion (x, y, z, t ) soit le centre de H il doit être réel (sans parties imaginaires)! 
Au même titre que pour les nombres complexes, nous pouvons définir un conjugué des quatemions: 
Définition: Le conjugué d'un quatemion Z = ( a,b,c,d ) est le quatemion Z = (a, ~b, ~c,~d) 

Au même titre que pour les complexes, nous remarquons que: 

1. D'abord de manière évidente que si z = Z a l° rs cela signifie que Z e IR • 

2. Que z + Ze IR 

3. Qu'en développant le produit z ■ Z nous avons: 

Z ■ Z = (a,b,c, d) • (a, ~b, -c, -d) 

= (a 2 +b 2 +c 2 + d 2 , -ah +ba ~cd + de, ~ae +ca +bd - db,da - ad - be + eb) (2.186) 

= {a 2 +b 2 +c 2 +tf a ,0,0,0) =a 2 +b 2 +c 2 +d 2 e IR 

que nous adopterons, par analogie avec les nombres complexes, comme une définition de la norme (ou 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


99/4839 







[SCIENCES.CH] 


module) des quatemions tel que: 


\Z\=4z~Z (2.187) 


Dès lors nous avons aussi immédiatement (relation qui nous sera utile plus tard): 


|ZZ j =^ZZV (ZZ 1 ) (2.188) 


Comme pour les nombres complexes (voir plus loin), il est aisé de montrer que la conjugaison est un 
automorphisme du groupe > H, + ■. 

Effectivement, soient Z = ( a,b,c,d ) et Z' = {a',b',c',d') alors: 



Il est aussi aisé de montrer qu'elle est involutive. Effectivement: 


Z = (a.-(-i).-(-c).-(-ûî)) = (a,b,c,d) = Z (2-190) 


La conjugaison n'est par contre pas un automorphisme multiplicatif du corps ■ H, +,xi. En effet, si nous 
considérons la multiplication de Z, Z et en prenons le conjugué: 


r aa'-bb'-cc'~ dd' ^ ( aa'~ bb'~cc'~ dd' 1 

{ab'+ba) + {cd'~dc') - ~{ab'+ba)-{cd'~dc') 

(ac '+ ca) - {bd'~db') ’ ~ ~{ac'+ca') + {bd'~db) 

^da'+ad) + (bc'-cb') j -(da'+ad’) -(bc'-cb')^ 


nous voyons immédiatement (ne serait-ce que pour la deuxième ligne) que nous avons: 

~ZZ'*ZY' (2.192) 

Revenons maintenant sur notre norme (ou module).... Pour cela, calculons le carré de la norme de |ZZ '| 

I zzf =.ZZV(ZZ) (2.193) 

Nous savons (par définition) que: 


aa'-bb'-cc'-dd' ^ 



(ab'+ba') +(cd '-de) 


(da '+ ad) + (bc '-cb) 


notons ce produit de manière telle que: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 
















Vincent ISOZ [v3.0-2013] 


Nous avons alors: 


en substituant il vient: 


[SCIENCES.CH] 


Z'Z'= <a,j8,y,A> = Z" (2.195) 


Z"-Z" = a 3 + j8 2 + y 2 + A 2 ( 2 . 196 ) 


i 2 


(ZZ ) ■ (ZZ ') = ' aa bb ce dd ' > + i ab '+ ba '+ cd de 
+ ' ac'+ ca'-hd '+ db'< 2 + < da'+ ad'+ bc'-cb' ? 


, 2 


(2.197) 


après un développement algébrique élémentaire (honnêtement ennuyeux), nous trouvons: 

(ZZ)'(ZZÔ = {a' 2 + b' 2 + c' 2 + d ,2 )\a 2 +b 2 +c 2 +d 2 | =Z' 2 |Z| 2 (2.198) 

Donc: 


(ZZ ) • (ZZ ') = |z | 2 \Z f = |ZZ X ( 2 - 199 ) 


Remarque: La norme est donc un homomorphisme de ■ H,x i dans ( M,:< i. Par la suite, nous 
noterons G l'ensemble des quatemions de norme 1. 


2.8.1. INTERPRETATION MATRICIELLE 

Soient q et p deux quaternions donnés, soit l'application: 

p^q'p 

La multiplication (à gauche) peut être faite avec une application linéaire (cf. chapitre d'Algèbre 
Linéaire) sur H. 

Si q s'écrit: 


a 

+ bi + 

CJ + 

dk 

cette application a pour matrice, dans la base 1, 

U h 1 

’c 


a 

~b 

~c 

~d 


b 

a 

-d 

c 


c 

d 

a 

-b 


d 

~c 

b 

a 


( 2 . 201 ) 


J 


Ce que nous vérifions bien: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


101/4839 

















Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


ZZ' = 


a ~b ~c ~d 
h a ~d c 
c d a ~b 
d ~c b a 



a ' 

f 


b' 



c ' 



d' 

L 


act '~bb cc dd ' ' 
{ab'+ba') + {cd'-dc" } 
(ac'+ca)-(bd'-db) 
{da '+ad') + {bc cb ) 


( 2 . 202 ) 


En fait, nous pouvons alors définir les quaternions comme l'ensemble des matrices ayant la structure 
visible ci-dessus si nous le voulions. Cela les réduirait alors à un sous espace vectoriel de M 4 f IR. i. 


En particulier, la matrice de 1 (la partie réelle du quatemion q ) n'est alors rien d'autre que la matrice 
identité: 


de même: 


2.8.2. ROTATIONS 


M, = 


1 0 0 0 ' 
0 10 0 
0 0 10 
0 0 0 1 


= 1 (2.203) 



'0 

-1 

0 

0' 


'0 

0 

-1 

0' 


'0 

0 

0 

-1' 


1 

0 

0 

0 


0 

0 

0 

1 


0 

0 

-1 

0 

M. = 





,M< = 





,M k = 





2 

0 

0 

0 

-1 

? J 

1 

0 

0 

0 


0 

1 

0 

0 


0 

0 

1 

0 


0 

-1 

0 

0 


1 

0 

0 

0 


(2.204) 


Nous allons maintenant voir que la conjugaison par un élément du groupe G des quaternions de norme 
unité peut s'interpréter comme une rotation pure dans l'espace! 

Définition: La "conjugaison" par un quatemion q non nul et de norme unité est l'application S q définie 
sur H par: 


1 = <? ■ p q 


(2.205) 


et nous affirmons que cette application est une rotation. 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


102/4839 






















Vérifions maintenant que l'application est bien une rotation pure. Comme nous l'avons vu lors de notre 
étude de l'algèbre linéaire et en particulier des matrices orthogonales (cf. chapitre d'Algèbre Linéaire), 
une première condition est que l'application conserve la norme. 

Vérifions: 


\s q ( p )I = \rn\ = \q I \p\\q\ = \p I (2.207) 

Par ailleurs, nous pouvons vérifier qu'une rotation d'un quatemion purement complexe (tel qu'alors 
nous nous restreignons à ]jj 3 ) et la même rotation inverse sommées est nulle (le vecteur sommé à son 
opposé s'annulent): 

^ ( P ) + ( p ) = qpq + qpq = qpq+q ( pq ) (2 208) 

nous vérifions trivialement que si nous avons deux quatemions q,p alors p ■ q = q-p dès lors: 

[p)+S (p)= qpq+q(pq)= qpq+(pq)q =q-p-q+q'p-q 
H H (2.209) 

= q- p'q + q'P'q =S q (p+p) 

pour que cette opération soit nulle, nous voyons immédiatement que nous devons restreindre p aux 
quatemions purement complexes. Dès lors: 

S q (p + p)=S q (()) = 0 (2.210) 

Nous en déduisons alors que p doit être purement complexe pour que l'application S soit une rotation 
et que S q (p) est un quatemion pur. En d'autres termes, cette application est stable (en d'autres termes: 
un quatemion pur par cette application reste un quatemion pur). 

S q restreint à l'ensemble des quatemions purement complexes est donc une isométrie vectorielle, c'est- 
à-dire une symétrie ou une rotation. 

Nous avons vu également lors de notre étude des matrices de rotation dans le chapitre d'Algèbre 

[Vincent ISOZ] | http://www.sciences.ch] | Page: 


103/4839 



















Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

Linéaire que l'application A devait être de déterminant 1 pour que nous ayons une rotation. Voyons si 
c'est le cas de : 

Pour cela, nous calculons explicitement en fonction de: 

q=a+bi+cj+dk (2.211) 


la matrice (dans la base canonique ) de S et nous en calculons le déterminant. Ainsi, nous 

obtenons les coefficients des colonnes de A en se rappelant que: 


i‘j -j'i 

j-k =ï = -k-j 

k'i = J = -i’k 

i’=/=**=-! 


( 2 . 212 ) 


et ensuite en calculant: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


104/4839 






Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

Sq(i)= (a + bi+cj + dk)i (a- bi-cj - dk ) 

= +b(i 2 ) + c(ji) +dfjti)j(a -bi-cj- dk) = (ai —b — ck+dj)(a -bi-cj- dk ) 

= {a i + ab - ack + adj ) - (ba -b i—bcj— bdk) 

-{cak- cbj + c 2 i +cd) + {daj + dbk + cd - d 2 i ) 

= +b 2 -c 2 -d 2 ^i + - ack + adj ) - (ba^-bcj - bdk) 

-{cak- cbj + 'fâj + {daj + dbk + 

- f^a 2 +b 2 - c 2 -d 2 ^i+2(ad + bc')j+2(bd-ac')k 

S q {j) = {a+U+cj + dk)j{a -bi-cj-dk) 

= {^aj +b(ij) + c(j 2 ) + d{kj) J {a -bi-cj- dk) = (aj +bk - c - di}(a — bi — cj - dk') 

= {a 2 j + abk + ac- adi) + {bak -b 2 j +bci +bd) 

-{ca-cbi-c j -cdk) - {dai + db- dck + d j) (2.213) 

= (^a 2 - b 2 + c 2 -d 2 ^j + {abk + jxé - adi) + {bak + bci + ^t£) 

-{jzé - cbi - cdk) - {dai + - dck) 

= 2(bc -ad)i + {a 2 -b 2 +c 2 -d 2 ^j + 2(ab + cd)k 

(A:) = {a + bi + cj + dk)k{a -bi-cj - dk) 

= ^ak + b{ik) +c{jk) + d{k 2 Ÿj (a — bi — cj — dk) = (ak-bj+ci — d~)(a — bi — cj — dk') 

= {a 2 k- abj +aci +ad) - {abj +b 2 k + bc -bdï) 

+{cai +cb- c 2 k + cdj) - {da - dbi - dcj - d 2 k) 

= ^fl 2 - b 2 -c 2 + d 2 ^k + {-abj + ati + 'cldj) - {abj + - bdï) 

+{cai + ^ + cdj) - - dbi - dcj) 

- 2(ac + bd^i + 2(cd -ab') j + {^a 2 - b 2 - c 2 +d 2 ^k 

Il faut alors calculer le déterminant de la matrice (pfff...): 

a 2 +b 2 - c 2 - d 2 2{ad+bc) 2{bd-ac) 

2{bc-ad) a? - b 2 +c 2 - d 2 2{ab+cd) 

2{ac +bd) 2{cd-ab) a 2 -b 2 -c 2 +d 2 

(2.214) 

en se souvenant que (ce qui permet aussi de simplifier l'expression des termes de la diagonale comme 
nous pouvons le voir dans certains ouvrages): 

a 2 +b 2 +c 2 + d 2 = 1 (2-215) 

nous trouvons que le déterminant vaut bien 1. Sinon, nous pouvons vérifier cela avec Maple: 

[Vincent ISOZ] | http://www.sciences.ch] | Page: 


105/4839 








Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

>with(linalg): 

> A:=linalg[matrix](3,3,[a A 2+b A 2-c A 2-d A 2,2*(a*d+b*c),2*(b*d-a*c),2*(b*c-a*d),a A 2-b A 2+c A 2-d A 2,2* 
(a*b+c*d),2*(a*c+b*d),2*(c*d-a*b),a A 2-b A 2-c A 2+d A 2]); 

> factor(det(A)); 

Montrons maintenant que cette rotation est un demi-tour d'axe (l'exemple qui peut sembler particulier 
est général!): 

D'abord, si: 


q = xi + yj + zk ( 2 . 216 ) 


nous avons: 


S Q {q)=q'q-q=q ( 2 . 217 ) 

ce qui signifie que l'axe de rotation (x, y, z ) est fixé par l'application S elle-même ! 

D'autre part, nous avons vu que si q est un quatemion purement complexe de norme 1 alors: 

q~ l =qet q = -q ( 2 . 218 ) 


Ce qui nous donne la relation: 


q 2 = q'(~q) = q '("O?" 1 )) = -1 < 2 - 219 ) 

Ce résultat nous amène à calculer la rotation d'une rotation: 

■A, i ^ (p)) = q yqpq )q = q 2 pq 2 = = (-1 )p ( ~q ) 2 

= (-l )pq 2 =(-!)/•'(-1) =P 


( 2 . 220 ) 


Conclusion: Puisque la rotation d'une rotation est un tour complet, alors S est nécessairement un 
demi-tour : 


(p) = ~P 


par rapport (!) à l'axe (x, y, z). 

A ce stade, nous pouvons affirmer que toute rotation de l'espace peut se représenter par S (la 

conjugaison par un quatemion q de norme 1). En effet, les demi-tours engendrent le groupe des 
rotations, c'est-à-dire que toute rotation peut s'exprimer comme le produit d'un nombre fini de 
demi-tours, et donc comme la conjugaison par un produit de quatemions de norme 1 (produit qui est 
lui-même un quatemion de norme 1 ...). 

Nous allons tout de même donner une forme explicite reliant une rotation et le quatemion qui la 
représente, au même titre que nous l'avons fait pour les nombres complexes. 

Soit ü(x,y,z ) un vecteur unitaire et 8 e [0, 2tt\ un angle. Alors nous affirmons que la rotation d'axe ü 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


106/4839 






Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


et d'angle 8 correspond à l'application S q , où q est le quatemion: 


cos — 


2 


xsin — 


e 


q = cos — + xsin — i + .y sin — j + z sin — k = 


8 . 8 . . 8 . .8 


8 . 8 _ 


( 2 . 221 ) 

8 


cos —, sin —u 


2 ’ 2 


2 2 2 2 


2 


y sin — 
2 


z sin — 


Pour que cette affirmation soit vérifiée, nous savons qu'il faut que: la norme de q soit unitaire, le 
déterminant de l'application S soit égal à l'unité, que l'application S conserve la norme, que 

l'application S q renvoie tout vecteur colinéaire à l'axe de rotation sur l'axe de rotation. 

1. La norme du quatemion proposé précédemment vaut effectivement 1 : 



( 2 . 222 ) 


et comme ü(x,y,z) est unitaire alors nous avons: 


x 2 + y 2 +z 2 = 1 ( 2 . 223 ) 


Donc: 


\q\- cos 2 — + sin 2 — i x 2 +y 2 +z 2 i = cos 2 — + sin 2 — = 1 ( 2 . 224 ) 



2. Le fait que q soit un quatemion de norme 1 amène immédiatement à ce que le déterminant de 
l'application S soit unitaire. Nous l'avons déjà montré plus haut dans le cas général de n'importe quel 
quatemion de norme 1 (condition nécessaire et suffisante). 

3. Il en est de même pour la conservation de la norme. Nous avons déjà montré plus haut que c'était de 
toute façon le cas dès que le quatemion q était de norme 1 (condition nécessaire et suffisante). 

4. Voyons maintenant que tout vecteur colinéaire à l'axe de rotation est projeté sur l'axe de rotation. 
Notons q' le quatemion purement imaginaire et unitaire xi + yj + zk. Nous avons alors: 


8 8 

q = cos — + sin — q' ( 2 . 225 ) 
2 2 


Alors: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 










Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


S q {q')=qq'q ( 2 . 226 ) 


mais comme q' est la restriction de q à ces éléments purs qui le constituent, cela revient à écrire: 

S q \q ') = (q) = qqq = q (2.227) 

Montrons maintenant le choix de l'écriture 9/ 2 . Si v = (x 1? y^zj) désigne un vecteur unitaire 
orthogonal à Ü (perpendiculaire à l'axe de rotation donc), et p le quatemion + y^j + z^k alors nous 
avons: 


, ( 9 . 9 \ 

i p ) = \ cos - + sin-ij 


[ 8 . 8 , 
p cos — - sin — q 
2 2 


2 8 8 . 8 f , ,v 2^1 1 

cos -p + cos-sm-\q p~pq i - sm — qpq 


( 2 . 228 ) 


Nous avons montré lors de la définition de la multiplication de deux quatemions que: 

pq' = ~q'p ( 2 . 229 ) 

nous obtenons alors: 

V^ I = C0S -P + ^cos-sm-q p-sm -q pq 


8 . 8 , 2 ^ , rv 

= cos — p + 2cos — sm — q p + sm —qp{~qj 

2 & ^ t ■ 2 & \ ~ 

= cos —p + i cos — sm — q z?+sin —q pq 

2 2 2 2 


( 2 . 230 ) 


Nous avons également montré plus haut que: 


s a (p) = -p = qpq ( 2 - 231 > 


dès lors: 


q 'pq ' = s a . (p) = -p (2.232) 


(le demi-tour d’axe (x, y, z )). Donc: 


9 


9 . 9 


9 


S 1 p > = cos —p + 2 cos — sin —q p - sin —p 


2 9 2 ^ 1 r. & ■ & I 

cos —-sin — \p + 2cos — sm — q p 

2 2 2 2 


= cos 9p + sin 9q 'p 


( 2 . 233 ) 


Remarque: Nous commençons à entrevoir ici déjà l'utilité d'avoir écrit dès le début 8i 2 pour 
l'angle! 




J 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


108/4839 















Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


Nous savons que p est le quatemion pur assimilé à un vecteur unitaire v orthogonal à l'axe de rotation 
u, lui-même assimilé à la partie purement imaginaire de q'. Nous remarquons alors de suite que la 
partie imaginaire du produit (défini!) des quatemions q p est alors égal au produit vectoriel iTxv = w. 

Ce produit vectoriel engendre donc un vecteur perpendiculaire à u, v et donc \ü,v, vD i. 

Le couple (v, w) forme donc un plan perpendiculaire à l'axe de rotation ü (c'est comme pour les 
nombres complexes simples dans lequel nous avons le plan de Gauss et perpendiculairement à celui-ci 
un axe de rotation!). 

Alors finalement: 

{p) = cos dp + sin 9q 'p = cos 9v + sin 9\v (2.234) 

Nous nous retrouvons avec une rotation basée sur un plan (mais qui a donc lieu dans l'espace!) 
identique à celle présentée plus haut avec les nombres complexes standards dans le plan de Gauss. 

Nous savons donc maintenant comment faire n'importe quel type de rotation dans l'espace en une seule 
opération mathématique et ce en plus par rapport à un libre choix de l'axe ! 

Nous pouvons aussi maintenant mieux comprendre pourquoi l'algèbre des quatemions n'est pas 
commutative. Effectivement, les rotations vectorielles du plan sont commutatives mais celles de 
l'espace ne le sont pas comme nous le montre l'exemple ci-dessous : 

Soit la configuration initiale : 


Y 



Figure: 2.8 - Situation initiale pour rotations quaternions 


Alors une rotation autour de l'axe X suivie d'une rotation autour de l'axe Y : 



Figure: 2.9 - Exemple de rotation de quaternions 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 
























Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


n'est pas égale à une rotation autour de l'axe Y suivie d'une rotation autour de l'axe X : 


Y h Y 



Figure: 2.10 - Exemple de non équivalence pour rotation quaternions 

Les résultats obtenus seront fondamentaux pour notre compréhension des spineurs (cf. chapitre de 
Calcul Spinoriel)! 

2.9. NOMBRES ALGÉBRIQUES ET TRANSCENDANTS 

Définitions: 

DI. Nous appelons "nombre entier algébrique de degré n", tout nombre qui est solution d'une équation 
algébrique de degré n, à savoir: un polynôme de degré n (concept que nous aborderons dans la section 
d'Algèbre) dont les coefficients sont des entiers relatifs et dont le coefficient dominant vaut 1. 

D2. Nous appelons "nombre algébrique de degré n ", tout nombre qui est solution d'une équation 
algébrique de degré n, à savoir: un polynôme de degré n dont les coefficients sont des rationnels. 

Un premier résultat intéressant et particulier dans ce domaine d'étude (curiosité mathématique...) est 
qu'un nombre rationnel est un "nombre entier algébrique de degré n " si et seulement si c'est un entier 
relatif (lisez plusieurs fois au besoin...). En termes savants, nous disons alors que l'anneau Z est 
"intégralement clos". 

Démonstration: 

Nous supposons que le nombre plq, où p et q sont deux entiers premiers entre eux (c'est-à-dire dont le 
rapport ne donne pas un entier ou plus rigoureusement... que le plus grand commun diviseur est 1 !), est 
une racine du polynôme (cf. chapitre de Calcul Algébrique) suivant à coefficients entiers relatifs et dont 
le coefficient dominant est unitaire: 

X* + + ... + fljX + l3 0 (2.235) 

où l'égalité avec zéro du polynôme est implicite. 

Dans ce cas: 


P* = “K-l P*~' + ••• + a \PÇ*~ 2 + ao?*” 1 )? (2.236) 

Puisque les coefficients sont par définition tous entiers et leurs multiples aussi dans la parenthèse, alors 
la parenthèse à nécessairement une valeur dans Z • 

Ainsi, q (à droite de la parenthèse) divise une puissance de p (à gauche de l'égalité), ce qui n'est 
possible, dans l'ensemble Z (car notre parenthèse a une valeur dans cet ensemble pour rappel...), que 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


110/4839 
















Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

si q vaut +1 (puisqu'ils étaient premiers entre eux). 

Donc parmi tous les nombres rationnels, les seuls qui sont solutions d'équations polynomiales à 
coefficients entiers relatifs et dont le coefficient dominant est unitaire sont des entiers relatifs! 

nC.Q.F.D. 

Pour prendre un autre cas intéressant et particulier, il est facile de montrer qu'absolument tout nombre 
rationnel est un "nombre algébrique". Effectivement, si nous prenons le plus simple polynôme suivant: 

qx-p= 0 (2.237) 

où q Qtp sont premiers entre eux et où q est différent de 1. Alors comme il s'agit d'une polynôme à 
coefficients rationnels simple, après remaniement nous avons: 

P 

* = — (2.238) 

<7 

Donc puisque q et p sont premiers entre eux et que q est différent de l'unité, nous avons bien que tout 
nombre rationnel est un "nombre algébrique de degré 1". 

Ainsi, la quantité de nombres rationnels "algébriques" est plus grande que le nombre de rationnels qui 
sont des "entiers algébriques". 

Nous avons aussi le nombre réel (et irrationnel) ^2 quiest un "nombre entier algébrique de degré 2", 
car il est racine de: 


j; 2 - 2 = 0 (2.239) 

et le nombre complexe i qui est aussi un "nombre entier algébrique de degré 2", car il est racine de 
l'équation: 


X 2 + 1 = Û (2-240) 


etc... 

Définition: Les nombres qui ne sont pas algébriques (entiers ou non!) sont transcendants. 

L'ensemble de tous les nombres transcendants est non dénombrable. La preuve est simple et ne 
nécessite aucun développement mathématique difficile. 

Effectivement, puisque les polynômes à coefficients entiers sont dénombrables, et puisque chacun de 
ces polynômes possède un nombre fini de zéros (voir le théorème de factorisation dans le chapitre de 
Calcul Algébrique), l'ensemble des nombres algébriques est dénombrable! Mais l'argument de la 
diagonale de Cantor (cf. chapitre de Théorie des Ensembles) établit que les nombres réels (et par 
conséquent les nombres complexes aussi) sont non dénombrables, donc l'ensemble de tous les nombres 
transcendants doit être non dénombrable. 

En d'autres termes, il y a beaucoup plus de nombres transcendants que de nombres algébriques. 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


111/4839 






Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

Les transcendants les plus connus sont n et e . Les démonstrations de leur transcendance est en cours 
de rédaction. Nous devrions pouvoir vous les fournir fin 2014. 

2.10, NOMBRES ABSTRAITS 


Le nombre peut être envisagé en faisant abstraction de la nature des objets qui constituent le 
groupement qu'il caractérise et ainsi qu'à la façon de codifier (chiffre arabe, romain, ou autre système 
universel). Nous disons alors que le nombre est "abstrait". 



Pour les mathématiciens, il n'est pas avantageux de travailler avec ces symboles car ils représentent 
uniquement des cas particuliers. Ce que cherchent les physiciens théoriciens ainsi que les 
mathématiciens, ce sont des "relations littérales" applicables dans un cas général et que les ingénieurs 
puissent en fonction de leurs besoins changer ces nombres abstraits par les valeurs numériques qui 
correspondent au problème qu'ils ont besoin de résoudre. 

Ces nombres abstraits appelés aujourd'hui communément "variables" ou "inconnues", utilisées dans le 
cadre du "calcul littéral", sont très souvent représentés par: 

1. L'alphabet latin: 


a, b, c, d, e...x, y, z ; A, B, C, D, E... (2.241) 

où Les lettres minuscules du début l'alphabet latin (a, b, c, d, e...) sont souvent utilisées pour 
représenter de manière abstraite des constantes, alors que les lettres minuscules de la fin de l'alphabet 
latin (...x, y, z ) sont utilisées pour représenter des entités (variables ou inconnues) dont nous 
recherchons la valeur. 

2. L'alphabet grec: 


Aa 

Alpha 

AA 

Lambda 

Bp 

Beta 

Mp 

Mu 

Ty 

Gamma 

Nv 

Nu 

A ô 

Delta 

[I] 

■r-rr. 

Xi 

Bs 

Epsilon 

Oo 

Omicron 

zç 

Zêta 

n n 

Pi 

H 7} 

Eta 

Vp 

Rho 


Thêta 

Sct 

Sigma 

If 

Iota 

Tr 

Tau 

Ktc 

Kappa 

Tu 

Upsilon 


Phi 

xz 

Chi 

Ty/ 

Psi 

Qo 

Oméga 


Tableau: 2.5 - Alphabet Grec 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


112/4839 




























Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

qui est particulièrement utilisé pour représenter soit des opérateurs mathématiques plus ou moins 
complexes (comme la somme indexée 2 , le variationnel <5, l'élément infinitésimal s, le différentiel 

partiel d, etc.) soit des variables dans le domaine de la physique (comme 0 pour la pulsation, la 
fréquence v, la densité P, etc.). 

3. L'alphabet hébraïque (à moindre mesure) 

CÂ~s - 

Remarque: Comme nous l'avons vu, les nombres transfinis sont par exemples donnés par la lettre 
K 0 "aleph". 

V_ 


Bien que ces symboles puissent représenter n'importe quel nombre il en existe quelques-uns qui 
peuvent représenter en physique des valeurs dites "constantes Universelles" comme la vitesse de la 
lumière c, la constante gravitationnelle G, la constante de Planck h, etc. 


Nous utilisons très souvent encore d'autres symboles que nous introduirons et définirons au fur et à 
mesure. 



2.11, DOMAINES DE DÉFINITION 


Une variable est un nombre abstrait susceptible de prendre des valeurs numériques différentes. 
L'ensemble de ces valeurs peut varier suivant le caractère du problème considéré. 

Définitions: 

DI. Nous appelons "domaine de définition" d'une variable, l'ensemble des valeurs numériques qu'elle 
est susceptible de prendre entre deux valeurs finies ou infinies appelées "bornes". 

Soient a et b deux nombres tel que a < b ■ Alors: 

D2. Nous appelons "intervalle fermé d'extrémités a et b", l'ensemble de tous les nombres x compris 
entre ces deux valeurs incluses et nous le désignons de la façon suivante: 

[a,b] = {x E IR | a < x < b) (2.242) 

D3. Nous appelons "intervalle ouvert d'extrémités a et b", l'ensemble de tous les nombres x compris 
entre ces deux valeurs non incluses et nous le désignons de la façon suivante: 

]a,b[= {ïê IR | a < x < à) (2.243) 

D4. Nous appelons "intervalle fermé à gauche, ouvert à droite" l'ensemble suivant: 

[a,b[= (ïê IR \a < x < b) (2.244) 

D5. Nous appelons "intervalle ouvert à gauche, fermé à droite" l'ensemble suivant: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


113/4839 



















Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

]a,b] = (xe IR | a < x < à} (2.245 


Soit sous forme résumée et imagée: 


[a,b] 

a h 

r i 

a <x<b 

Intervalle fermé borné 

-1 i - 

[a,b[ 

a b 

r r 

a <x <b 

Intervalle borné semi-fermé en a et 
semi-ouvert en b (ou semi-fermé à 
gauche et semi-ouvert à droite) 

c t 

}a,b] 

a h 

i i 

a <x<b 

Intervalle borné semi-ouvert en a 
et semi-fermé en b (ou semi-ouvert 
à gauche et semi-fermé à droite) 

] J 

]a,b[ 

a b 

1 r 

a < x <h 

Intervalle ouvert borné. 

-] t- 

y™,b] 

b 

1 

x<b 

Intervalle non borné fermé en b (ou 
fermé à droite) 

J 

]-™,b[ 

b 

r 

x <b 

Intervalle non borné ouvert en b 
(ou ouvert à droite) 

L 

[a ,+oa [ 

a 

r 

a < x 

Intervalle non borné fermé en a (ou 
fermé à gauche) 

L 

]$,+CO [ 

a 

a < x 

Intervalle non borné ouvert en a 
(ou ouvert à gauche) 

J 


Tableau: 2.6 - Types d'intervalles et de bornes 



Nous disons que la variable x est "ordonnée" si en représentant son domaine de définition par un axe 
horizontal où chaque point de l'axe représente une valeur de x, alors pour chaque couple de valeurs, 
nous pouvons indiquer celle qui est "antécédente" (qui précède) et celle qui est "conséquente" (qui 
suit). Ici la notion d'antécédente ou de conséquente n'est pas liée au temps, elle exprime juste la façon 
d'ordonner les valeurs de la variable. 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


114/4839 


































Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

Définitions: 

Dl. Une variable est dite "croissante" si chaque valeur conséquente est plus grande que chaque valeur 
antécédente. 

D2. Une variable est dite "décroissante" si chaque valeur conséquente est plus petite que chaque valeur 
antécédente. 

D3. Les variables croissantes et les variables décroissantes sont appelées "variables à variations 
monotones" ou simplement "variables monotones". 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


115/4839 






Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 



[Vincent ISOZ] | http://www.sciences.ch] | Page: 


116/4839 






















































































Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


117/4839 






















































































Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


118/4839 






















































































Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


119/4839 






















































































Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


3. OPÉRATEURS ARITHMÉTIQUES 


p 

J. arler des nombres comme nous l'avons fait dans le chapitre précédent amène naturellement à 

considérer les opérations de calculs. Il est donc logique que nous fassions une description non 
exhaustive des opérations qui peuvent exister entre les nombres. Ce sera l'objectif de ce chapitre. 

Nous considérerons sur ce site qu'il existe deux types d'outils fondamentaux en arithmétique (nous ne 
parlons pas de l'algèbre mais de l'arithmétique!): 

1. Les opérateurs arithmétiques: 

Il existe deux opérateurs de base (addition et soustraction) à partir desquels nous pouvons construire 
d'autres opérateurs: la "multiplication" et la "division". 

Ces quatre opérateurs sont couramment appelés "opérateurs rationnels". Nous verrons ces derniers plus 
en détails après avoir défini les relations binaires. 


Remarque: Rigoureusement l'addition suffirait si nous considérons l'ensemble commun des réels car 
dès lors la soustraction n'est que l'addition d'un nombre négatif. 


2. Les opérateurs (relations) binaires: 

Il existe 6 relations binaires fondamentales (égal, différent de, plus grand que, plus petit que, plus grand 
ou égal, plus petit ou égal) qui permettent de comparer des grandeurs d'éléments se trouvant à gauche 
et à droite (donc au nombre de deux, d'où leur nom) afin d'en tirer certaines conclusions. 

Il est bien évidemment essentiel de connaître au mieux ces deux outils et leurs propriétés avant de se 
lancer dans des calculs plus ardus. 

1. RELATIONS BINAIRES 


Le concept de "relation" est la base de toute la mathématique dont le but est d'étudier - par observation 
et déduction (raisonnement), calcul et comparaison - des configurations ou relations abstraites ou 
concrètes de ses objets (nombres, formes, structures) en cherchant à établir les liens logiques, 
numériques ou conceptuels entre ces objets. 

Définitions: 

DI. Considérons deux ensembles non vides E et F ( ) non 

nécessairement identiques. Si à certains éléments x de E nous pouvons associer par une règle 
mathématique précise R (non ambiguë) un élément y de F, nous définissons ainsi une "relation 
fonctionnelle" de E vers F et qui s'écrit: 


R-.E^F (3.1) 

Ainsi, de façon plus générale, une relation fonctionnelle R peut être définie comme une règle 
mathématique qui associe à certains éléments x de E, certains éléments y de F. 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


120/4839 










Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

Alors, dans ce contexte plus général, si xRy, nous disons que y est une "image" de x par R et que x est 
un "antécédent" ou "pré-image" de y. 

L'ensemble des couples (x, y) tels que xRy soit une assertion vraie forme un "graphe" ou une 
"représentation" de la relation R. Nous pouvons représenter ces couples dans un repère adéquatement 
choisi pour faire une représentation graphique de la relation R. 

Il s'agit d'un type de relations sur lequel nous reviendrons dans le chapitre d'Analyse Fonctionnelle et 
qui ne nous intéresse pas directement dans ce chapitre. 

D2. Considérons un ensemble A non vide, si nous associons à cet ensemble (et à celui-ci uniquement!) 
des outils permettant de comparer les éléments le composant alors nous parlons de "relation binaire" ou 
"relation de comparaison" et qui s'écrit pour tout élément x et _y composant A: 

xRy (3.2) 

Ces relations peuvent aussi être représentées sous forme graphique. Dans le cas des opérateurs binaires 
classiques de comparaisons où A est l'ensemble des nombres naturels, relatifs, rationnels ou réels, cette 
forme graphique est représentée par une droite horizontale (le plus souvent...); dans le cas de la 
congruence (cf. chapitre de Théorie des Nombres) elle est représentée par des droites dans le plan dont 
les points sont donnés par la contrainte de la congruence. 

Comme nous l'avons déjà dit, il existe 6 relations binaires fondamentales (égal, différent de, plus grand 
que, plus petit que, plus grand ou égal, plus petit ou égal). Mais nous verrons un peu plus loin que la 
définition rigoureuse des relations binaires permet donc de construire des outils plus abstraits (comme 
par exemple la congruence bien connue par les élèves de petites classes et que nous étudierons dans le 
chapitre de Théorie des Nombres). 

1.1. ÉGALITÉS 


Il est fort difficile de définir la notion "d'égalité" dans un cas général applicable à toute situation. Pour 
notre part, nous nous permettrons pour cette définition de nous inspirer du théorème d'extensionalité de 
la théorie des ensembles (que nous verrons plus tard): 

Définitions: 

DI. Deux éléments sont égaux si, et seulement si, ils ont les mêmes valeurs. L'égalité est décrite par le 
symbole = qui signifie "égal à". 

Propriété (triviale): Si nous avons a = b , et c un nombre et * une opération quelconque (telle que 
l'addition, la soustraction, la multiplication ou la division) alors: 

a *c = b*c (3.3) 

Cette propriété est très utilisée pour résoudre ou simplifier des équations de type quelconque. 

D2. Si deux éléments ne sont pas égaux (donc sont inégaux...), nous les relions par le symbole * et 
nous disons qu'ils sont "non égaux". 

Il existe encore d'autres symboles d'égalités, qui sont une extension des deux que nous avons définis 
précédemment. Malheureusement, ils sont assez souvent mal utilisés (disons plutôt qu'ils sont utilisés 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


121/4839 







Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

aux mauvais endroits) dans la plupart des ouvrages disponibles sur le marché: 

* ; = ; = ; s ; = ; * (3.4) 

qui correspondent dans l'ordre à: presque égal (plutôt utilisé en ingénierie), asymptotiquement égal à 
(utilisé en analyse fonctionnelle), approximativement égal (utilisé en physique lors d'approximation de 
séries), identique à (utilisé aussi bien en analyse fonctionnelle qu'en physique), tend vers la limite 
(idem) et enfin proportionnel à (utilisé en physique ou en mathématiques financières). 

1.2. COMPARATEURS 

Les comparateurs sont des outils qui nous permettent de comparer et d'ordonner tout couple de 
nombres (et in extenso aussi des ensembles!). 

La possibilité d'ordonner des nombres est presque fondamentale en mathématique. Dans le cas 
contraire (s'il n'était pas possible ou non imposé d'ordonner), il y aurait des tas de choses qui 
choqueraient nos habitudes, par exemple (certains des concepts présentés dans la phrase qui suit n'ont 
pas encore été vus mais nous souhaitons quand même y faire référence): plus de fonctions monotones 
(en particulier de suites) et lié à cela la dérivation n'indiquerait donc rien sur un "sens de variation", 
plus d'approche de zéros d'un polynôme par dichotomie (algorithme classique de recherche dans un 
ensemble ordonné partagé en deux à chaque itération), en géométrie, plus de segments ni de 
demi-droites, plus de demi-espace, plus de convexité, nous ne pouvons plus orienter l'espace, etc. C'est 
donc important de pouvoir ordonner les choses comme vous l'aurez compris. 

Ainsi, pour tout a.è.ceH nous écrivons lorsque a est plus grand ou égal à b: 

a >b (3.5) 


et lorsque a est plus petit ou égal à b: 


a <b (3.6) 


f~ \ 

Remarque: Il est utile de rappeler que l'ensemble des réels IR est un groupe totalement ordonné (cf. 
chapitre de Théorie Des Ensembles), sans quoi nous ne pourrions pas définir des relations d'ordre 
entre ses éléments (ce qui n'est pas le cas des nombres complexes que nous ne pouvons pas 
ordonner!). 

___ J 

Définition: Le symbole < est une "relation d'ordre" (voir la définition rigoureuse plus bas!) qui signifie 
"plus petit ou égal à " et inversement le symbole > est aussi une relation d'ordre qui signifie "plus grand 
ou égal à". 

Nous avons également concernant la relation de comparaison stricte (qui n'appartient pas à la famille 
des relations d'ordre pour des raisons que nous préciserons plus loin) les propriétés suivantes qui sont 
relativement intuitives: 


a < b et b < c (3.7) 


implique (ultérieurement noté "=> ") que: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


122/4839 












Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

a < c (3.8) 


Si: 


a < b etc >0 =î>û! , c<è , c (3.9) 


Si: 


inversement: 


Nous avons aussi: 


et inversement: 


a<.b=>ct + c<.b + c et a<.b=>a~c<.b~c (3.10) 


a >b=>a+cyb + c et a > b => a ~c > b ~c (3.11) 


0 < a < à — >— (3.12) 

a b 


è<a< 0 — <— (3.13) 

a b 


Nous pouvons bien évidemment multiplier, diviser, additionner ou soustraire un terme de chaque côté 
de la relation telle que celle-ci soit toujours vraie. Petite remarque cependant, si vous multipliez les 
deux membres par un nombre négatif il faudra bien évidemment changer le comparateur tel que si: 


et inversement: 


a < b et c > 0 => a • c < b ■ c (3.14) 


£î<Èetc<0=^£3!'c>È , c (3.15) 


Nous avons aussi: 


0<ü<èet;?e IR*’ + => a* < b ? (3.16) 


Soit: 


È<fl<0et^?e M* ,+ (3.17) 


Si p est un nombre entier pair alors: 


0 <a p <b p (3.18) 


sinon si p est impair: 


a* >b r (3-19) 

Ce résultat provient simplement de la multiplication des signes puisque la puissance lorsqu'elle est non 
fractionnaire n'est qu'une multiplication. 

[Vincent ISOZ] | http://www.sciences.ch] | Page: 


123/4839 






Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

Finalement: 


0 < a < b et«e N*=>^ < tjb (3-20) 

Les relations d'ordre : 

(3.21) 

correspondent donc respectivement à: (strictement) plus grand que, (strictement) plus petit que, plus 
petit ou égal à, plus grand ou égal à, beaucoup plus grand que et enfin beaucoup plus petit que. 

Les relations d'ordre peuvent être définies de façon un peu plus subtile et rigoureuse et abstraite et ne 
s'appliquent pas seulement aux comparateurs (voir par exemple la relation de congruence dans le 
chapitre de Théorie Des Nombres)! 

Voyons cela de suite (le vocabulaire qui va suivre est aussi défini dans le chapitre de Théorie Des 
Ensembles): 

Définition: Soit une relation binaire R d'un ensemble A vers lui-même, une relation R dans A est un 
sous-ensemble du produit cartésien ç A x A (c'est-à-dire que la relation binaire engendre un 
sous-ensemble de par les contraintes qu'elle impose aux éléments de A qui satisfont la relation) avec la 
propriété d'être: 

PL Une "relation réflexive" si Vx e A' 


x R x (3.22) 

P2. Une "relation symétrique" si Vx, y e A : 

x R y => y R x (3.23) 

P3. Une "relation antisymétrique" si Vx,y e A : 

(xRyetyRx) =ï x = y (3.24) 

P4. Une "relation transitive" si Vx, y, z e A : 

(.x Ry st y Rz ) => x R z (3.25) 

P5. Une "relation connexe" si Vx,y e A : 

V(x,y) E A=> (x R y ou y R x) (3.26) 

Les mathématiciens ont donné des noms particuliers aux familles de relations satisfaisant certaines de 
ces propriétés. 

Définitions: 

Dl. Une relation est appelée "relation d'ordre stricte" si et seulement si elle est uniquement transitive 
(certains spécifient alors qu'elle est donc forcément antiréflexive mais on s'en doute...). 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


124/4839 






Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

D2. Une relation est appelée un "pré-ordre" si et seulement si elle est réflexive et transitive. 

D3. Une relation est appelée "une relation d'équivalence" si et seulement si elle est réflexive, 
symétrique et transitive. 

D4. Une relation est appelée "relation d'ordre" si et seulement si elle est réflexive, transitive et 
antisymétrique. 

D5. Une relation est appelée "relation d'ordre total" si et seulement si elle est réflexive, transitive, 
connexe et antisymétrique. 

Pour les autres combinaisons il semblerait (?) qu'il n'y ait pas de désignations particulières chez les 
mathématiciens... 

C7 — — - 

Remarque: Les relations d'ordre binaire ont toutes des propriétés similaires dans les ensembles 
naturels, rationnels, relatifs et réels (il n'y a pas de relation d'ordre naturelle sur l'ensemble des 
nombres complexes). 

_ J 

Si nous résumons: 


Relation binaire 

= 


> 

< 

< 

> 

réflexive 

oui 

non 

non 

non 

oui 

oui 

symétrique 

oui 

oui 

non 

non 

non 

non 

transitive 

oui 

non 

oui 

oui 

oui 

oui 

connexe 

non 

non 

non 

non 

oui 

oui 

antisymétrique 

oui 

non 

non 

non 

oui 

oui 


Tableau: 3.1 - Types de relations binaires 


Ainsi, nous voyons que les relations binaires <, > forment avec les ensembles précités, des relations 
d'ordre total et qu'il est très facile de voir quelles relations binaires sont des relations d'ordre partiel, 
total ou d'équivalence. 


Définition: Si R est une relation d'équivalence sur A. Pour Vx e A , la "classe d'équivalence" de x est 
par définition l'ensemble: 


[x] = {yeA\ xRy} 


(3.27) 


[x] est donc un sous-ensemble de A ([x] ç A ) que nous noterons aussi... par la suite R (attention donc à 
ne pas confondre dans ce qui suit la relation d'équivalence et le sous-ensemble...). 


Nous disposons ainsi d'un nouvel ensemble qui est "l'ensemble des classes d'équivalences" ou 
"ensemble quotient" noté AIR. Ainsi: 

AIR = {[x] | xe (3.28) 


Il faut savoir que dans AIR nous ne regardons plus [x] comme un sous-ensemble de A mais comme un 
élément! 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


125/4839 

























Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

Une relation d'équivalence, de manière vulgarisée sert donc à coller une seule étiquette à des éléments 
qui vérifient une même propriété, et à les confondre avec ladite étiquette (en sachant ce que nous 
faisons avec cette étiquette). 

Exemple: 

Dans l'ensemble des entiers relatifs Z , si nous étudions les restes de la division par 2, nous avons que 
ceux-ci valent toujours soit 0 soit 1. 

La classe d'équivalence de zéro est alors appelée l'ensemble des nombres entiers pairs, la classe 
d'équivalence de 1 est appelée l'ensemble des entiers impairs. Nous avons donc deux classes 
d'équivalences pour deux partitions de Z (gardez toujours cet exemple simple en tête pour les éléments 
théoriques qui suivront cela aide énormément). 

Si nous nommons la première 0 et la deuxième 1, nous retrouvons les règles d'opérations entre nombres 
pairs et impairs: 


0 + 0 = 0 0 + 1 = 1 1+1=0 (3.29) 

ce qui signifie respectivement que la somme de deux entiers pairs est paire, que la somme d'un pair et 
d'un impair est impaire et que la somme de deux impairs est paire. 

Et pour la multiplication : 


0 0 = 0 0 1= 0 1-1=1 (3.30) 

ce qui signifie respectivement que le produit de deux pairs est pair, le produit d'un pair et d'un impair est 
pair et que le produit de deux impairs est impair. 

Et hop, nous avons déplacé les opérations de Z sur cet ensemble quotient noté Z / 2Z • 

Maintenant, pour vérifier que nous avons bien affaire à une relation d'équivalence, il faudrait encore 
vérifier qu'elle est réflexive (xRx), symétrique (si xRy alors yRx) et transitive (si xRy et yRz alors xRz). 
Nous verrons comment vérifier cela quelques paragraphes plus loin car cet exemple constitue un cas 
très particulier de relation de congruence. 

Définition: L'application n : A A/R définie par xb+ [x] est appelée "projection canonique". Tout 
élément ze[x] est alors appelé "représentant de la classe" [x]. 

Considérons maintenant un ensemble E. Alors nous proposons de démontrer qu'il y a bijection entre 
l'ensemble des relations d'équivalence sur E et l'ensemble des partitions de E. En d'autres termes cette 
proposition dit qu'une relation d'équivalence sur E n'est rien d'autre qu'une partition de E. 

Démonstration: 

Soit R une relation d'équivalence sur E. Nous choisissons 1= E f R comme ensemble d'indexation des 
partitions et nous posons pour tout [ x] e E! R , E^ : = [ x]. 

Il suffit de vérifier les deux propriétés suivantes de la définition des partitions pour montrer que la 
famille 1 E [x] \ est une partition de E: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


126/4839 






Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

PI. Soient [x],[.y]e E! R tels que [x] * [ 7 ] alors (trivial) = 0 . 

F = Il F 

P2. U h] est évident car si x e E alors ie[i] = E TA . 

[ *]=£/£ L J 


□C.Q.F.D. 

Encore une fois, il est aisé de vérifier avec l'exemple pratique de la division par 2 donné plus haut que 
la partition des nombres pairs et impairs satisfait ces deux propriétés. 

Nous avons donc associé à la relation d'équivalence R une partition de E. Réciproquement si ■ E i \ J est 

une partition de E alors nous vérifions facilement que la relation R définie par xRy si et seulement s'il 
existe tel tel que x,y e E i est une relation d'équivalence! Les deux applications ainsi définies sont 
bijectives et réciproques l'une de l'autre. 

Exemple: 

Nous allons à présent appliquer sur un exemple un peu moins trivial que le précédent ce que nous 
venons de voir à la construction des anneaux ZfdZ après quelques rappels (pour le concept d'anneau 
voir le chapitre de Théorie Des Ensembles). 

Rappels: 

RI. Soit deux nombres n,me. Z . Nous disons que "n divise m" et nous écrivons n\m si et seulement si 
il existe un entier k e X tel que m = k ■ n (cf. chapitre de Théorie Des Nombres). 

R2. Soit d > 1 un entier. Nous définissons la relation R par nRm si et seulement si d \ \n - m) ou dit 
autrement nRm si et seulement si il existe k e Z tel que n = m + k d ■ Généralement nous écrivons ceci 
aussi n = m (modulo d) au lieu de nRm et nous disons que "n est congru à m modulo d”. Rappelons 
aussi que n = 0 (modulo d) si et seulement si d divise n (cf. chapitre de Théorie Des Nombres). 

Nous allons maintenant introduire une relation d'équivalence sur Z • Démontrons que pour tout entier 
d > 1 , la congruence modulo d est une relation d'équivalence sur Z (nous avons déjà démontré cela 
dans le chapitre de théorie des nombres lors de notre étude de la congruence mais refaisons le travail 
pour le plaisir). 

Démonstration (contrôle des trois propriétés de l'équivalence): 

PL Réflexivité: n = n car n = « + 0 • d . 

P2. Symétrie: Si n = m alors n = m + kd et donc m=n + ( -k)d c'est-à-dire m = n . 

P3. Transitivité: Si n = m et m = j alors n = m + kd et m = j + k'd donc n = j + (k + k 1 ) • d c'est-à-dire 
n= j. 


□C.Q.F.D. 

Dans la situation ci-dessus, nous notons ZfdZ l'ensemble des classes d'équivalence et noterons [n] d la 
classe d'équivalence de la congruence d'un entier n donnée par: 

[Vincent ISOZ] | http://www.sciences.ch] | Page: 


127/4839 






Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

[n] d = \...,n~2d,n - d,n,n + d,n + 2 d,n + 3d,...j ( 3 . 31 ) 

(chaque différence de deux valeurs se trouvant dans les accolades est divisible par d et c'est bien ainsi 
une classe d'équivalence) et ainsi: 

Z/rfZ-{[0] i ,[l] s ,[2] lî .....y-H ; } ( 3 . 32 ) 

En particulier (trivial car nous obtenons ainsi tout Z ): 


Z/2Z = {[0] 2 ,[1] 2 } ( 3 . 33 ) 

Ainsi, nous voyons que le premier exemple que nous avions donné avec les nombres pairs et impairs est 
un cas particulièrement simple des classes d'équivalence de congruence modulo 2 car elles se réduisent 
toutes à seulement deux classes. 


c~ ~~ 

Remarque: Les opérations d'addition et de multiplication définies sur Z définissent des opérations 
d'addition et de multiplication sur z/ a?Z. Nous disons alors que ces opérations sont compatibles 
avec la relation d'équivalence et forment alors un anneau (cf. chapitre de Théorie Ensembles). 

___ J 

2. LOIS FONDAMENTALES DE L'ARITHMÉTIQUE 

Comme nous l'avons déjà dit précédemment, il existe un opérateur de base (addition) à partir duquel il 
possible de définir la multiplication, la soustraction (à condition que l'ensemble de nombres soit ad hoc) 
et la division (même remarque que pour la soustraction) et autour desquels nous pouvons construire 
toute la mathématique analytique. 

Bien évidemment il y a certaines subtilités à prendre en compte lorsque le niveau de rigueur augmente. 
Le lecteur peut alors se reporter au chapitre de Théorie Des Ensembles où ses lois fondamentales sont 
redéfinies avec plus de justesse. 



[Vincent ISOZ] | http://www.sciences.ch] | Page: 


128/4839 













Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

2.1. ADDITION 


Définition: L'addition de nombres entiers est une opération notée "+" qui a pour seul but de réunir en 
un seul nombre toutes les unités contenues dans plusieurs autres. Le résultat de l'opération se nomme 
"somme" ou "total". Les nombres à additionner sont appelés "termes de l'addition". 


Remarque: Les signes d'addition "+" et de soustraction sont dus à Widmann (1489). 


Ainsi, A+B+C... sont les termes de l'addition et le résultat est la somme des termes de l'addition. 

Voici une liste de quelques propriétés intuitives que nous admettrons sans démonstrations de l'opération 
de l'addition: 

P1. La somme de plusieurs nombres ne dépend pas de l'ordre des termes. Nous disons alors que 
l'addition est une "opération commutative". Ce qui signifie que nous avons quand A est différent de B: 

A-B*B-A 

P2. La somme de plusieurs nombres ne change pas si nous remplaçons deux ou plusieurs d'entre eux 
par leur résultat intermédiaire. Nous disons alors que l'addition est "opération associative". 

P3. Le zéro est l'élément neutre de l'addition car tout nombre additionné à zéro donne ce même 
nombre. 

P4. Suivant l'ensemble dans lequel nous travaillons, l'addition peut comporter un terme de telle façon à 
ce que le total soit nul. Nous disons alors qu'il existe un "opposé" pour l'addition. 

Nous allons définir plus rigoureusement l'addition en utilisant l'axiomatique de Peano dans le cas 
particulier de l'ensemble des nombres entiers naturels comme nous en avons déjà fait mention dans le 
chapitre traitant des Nombres. Ainsi, avec ces axiomes il est possible de démontrer qu'il existe 
(existence) une et une seule application (unicité), notée "+", de N x N dans N vérifiant: 

Vw e N,« + 0 = n 

< Vw e N, s(n) - n + 1 
Vp e N,Vi q e N,p +s(#) = s(p +q) 


où ^ signifie: "successeur". 


c -^ 

Remarque: Ce site n'ayant pas pour vocation de s'adresser à des mathématiciens, nous nous 
passerons de la démonstration (relativement longue) et admettrons intuitivement que l'application 

"+" existe et est unique... et qu'il en découle les propriétés susmentionnées. 

___ / 


Soient des nombres quelconques alors nous pouvons noter également la somme ainsi: 


X 1 + X 2 + - +*» 



( 3 . 34 ) 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


129/4839 

















Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

en définissant des bornes supérieure et inférieure à la somme indexée (au-dessus et en-dessous de la 
lettre grecque majuscule "sigma"). 

Voici quelques rappels des propriétés relatives à cette notation condensée: 

B B 

^ (3.35) 

i-l i-l 


où k est une constante et: 


= (3.36) 

i-l 

B B B 

= < 3 - 37 ) 

i-l i-l i-l 

Voyons maintenant quelques cas concrets d'additions de différents nombres simples afin de mettre en 
pratique les bases. 

Exemples: 

L'addition de deux nombres relativement petits est assez facile dès que nous avons appris par coeur à 
compter jusqu'au nombre résultant de cette opération. Ainsi (exemples pris sur la base décimale): 

5 10 1014 

+ 2 , + 3 , + 3 (3.38) 

= 7 = 13 = 1017 

Pour les plus grands nombres il faut adopter une autre méthode qu'il s'agit d'apprendre par coeur. Ainsi 
par exemple: 


9244 

+ 3475 (3.39) 

= ? 

Démarche: nous additionnons les colonnes (4 colonnes dans cet exemple) de droite à gauche. Pour la 
première colonne nous avons donc 4+5=9 ce qui nous donne: 

9244 

+ 3475 (3.40) 

= .9 

et nous continuons ainsi pour la deuxième 4+7=11 mais à la différence que comme nous avons un 
nombre supérieur à la dizaine, nous reportons le premier chiffre (de gauche) sur la colonne suivante de 
l'addition. Ainsi: 


92*44 

+ 3475 (3.41) 

= .19 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


130/4839 














Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

La troisième colonne se calcule dès lors comme 4+2+1=7 ce qui nous donne: 

92*44 

+ 5475 (3.42) 

= ...719 

Pour la dernière colonne nous avons 9+5=14 et à nouveau nous reportons le premier chiffre (de 
gauche) sur la colonne suivante de l'addition. Ainsi: 

1 92*44 

+ 5475 (3.43) 

= .4719 

et la dernière colonne donne: 

*92*44 

+ 5475 (3.44) 

= 14719 

Voilà comment nous procédons donc pour l'addition de nombres quelconques: nous faisons une addition 
par colonne de droite à gauche et si le résultat d'une addition est supérieur à la dizaine, nous reportons 
une unité sur la colonne suivante. 

Cette méthodologie d'addition est simple à comprendre et à effectuer. Nous ne étendrons pas plus sur le 
sujet pour l'instant. 

2.2. SOUSTRACTION 


Définition: La soustraction du nombre entier A par le nombre entier B notée par le symbole c'est 
trouver le nombre C qui, ajouté à B, redonne A. 


Remarque: L'opération n'est rigoureusement parlant pas possible dans les entiers naturels N que si 
A > B- 


Nous écrivons la soustraction sous la forme: 


A-B = C (3.45) 


qui doit vérifier: 


A = C+B (3.46) 

Voici quelques propriétés intuitives que nous admettrons sans démonstrations de l'opération de 
soustraction (bon cela découle de l'addition...): 

PL La soustraction de plusieurs nombres dépend de l'ordre des termes. Nous disons alors que la 
soustraction est une "opération non-commutative". Effectivement: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


131/4839 
















Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

5- 2* 2-5 (3.47) 

P2. La soustraction de plusieurs nombres change si nous remplaçons deux ou plusieurs d'entre eux par 
leur résultat intermédiaire. Nous disons alors que la soustraction est une "opération non-associative". 
Effectivement: 


5-(3-2)*(5-3)-2 (3.48) 

P3. Le zéro n'est pas l'élément neutre de la soustraction. Effectivement, tout nombre à qui nous 
soustrayons zéro donne ce même nombre, donc le zéro est neutre à droite... mais pas à gauche car tout 
nombre que nous soustrayons à zéro ne donne pas zéro! 

P4. Suivant l'ensemble dans lequel nous travaillons, la soustraction peut comporter un terme de telle 
façon à ce que le total soit nul. Nous disons alors qu'il existe un "opposé" pour la soustraction. 

Exemples: 

La soustraction de deux nombres relativement petits est assez facile dès que nous avons appris par 
coeur à compter jusqu'à au moins le nombre résultant de cette opération. Ainsi: 

5 10 1014 

- 2 , - 3 , -_3_ (3.49) 

= 3=7= 1011 

Pour les plus grands nombres il faut adopter une autre méthode qu'il s'agit d'apprendre par coeur (au 
même titre que l'addition). Ainsi par exemple: 


4574 

- 34B5 (3-50) 

= ? 

nous soustrayons les colonnes (4 colonnes dans cet exemple) de droite à gauche. Pour la première 
colonne nous avons 4 - 5 = -1 < 0 ce qui fait que nous reportons -1 sur la colonne suivante (deuxième) 
et écrivons 10-1 = 9 en bas de la barre d'égalité de la première colonne: 

4574 

- 3785 < 3 - 51 ) 

= .9 

et nous continuons ainsi pour la deuxième 7-8=-l<0 ce qui fait que nous reportons -1 sur la 
colonne suivante (troisième) et comme -1 -1 = -2 nous reportons 10-2 = 8 en bas de la barre 
d'égalité de la deuxième colonne: 


-î-i 

4574 
- 3785 

= .89 


(3.52) 


La troisième colonne se calcule dès lors comme 5 - 7 = -2 < 0 et nous reportons -1 sur la colonne 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


132/4839 














Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

suivante (quatrième) et comme -1 - 2 = -3 nous reportons 10-3 = 7 en bas de la barre d'égalité de 
la troisième colonne: 


-î-i-i 

4574 

- 3785 (3 - 53) 

= ...789 

Pour la dernière colonne nous avons 4 - 3 = 1 > 0 nous reportons donc rien sur la colonne suivante et 
comme 1-1 = 0 nous reportons 0 en bas de la barre d'égalité de la quatrième colonne: 

-i-1-i 

4 5 74 

- 3785 (3 ' 54) 

= 0789 

Voilà comment nous procédons donc pour la soustraction de nombres quelconques. Nous faisons une 
soustraction par colonne de droite à gauche et si le résultat d'une soustraction est inférieur à zéro nous 
faisons reporter -1 sur la colonne suivante et l'addition du dernier report sur la soustraction obtenue en 
bas de la barre d'égalité. 

La méthodologie utilisée pour la soustraction se basant sur exactement le même principe que l'addition 
nous ne nous étendrons pas plus sur le sujet. Cette méthode est très simple et nécessite bien sûr une 
certaine habitude à travailler avec les chiffres pour être totalement appréhendée. 

2.3. MULTIPLICATION 


Définition: La multiplication de nombres est une opération qui a pour but, étant donné deux nombres, 
l'un appelé "multiplicateur" m, et l'autre "multiplicande" M, d'en trouver un troisième appelé "produit" 
P qui soit la somme (donc la multiplication d'écoule de la somme!) d'autant de nombres égaux au 
multiplicande qu'il y a d'unités au multiplicateur: 


m 

mxM - ^ M - P 
1=1 


Le multiplicande et le multiplicateur sont appelés les "facteurs du produit". 

La multiplication s'indique à l'aide du signe " x " (anciennement) ou du point de ponctuation 
surélevé (notation moderne) ou sans aucun symbole tel que: 


axh = cr b = ab 


(3.56) 



Nous pouvons définir la multiplication en utilisant l'axiomatique de Peano dans le cas particulier des 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


133/4839 
















Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

nombres entiers naturels comme nous en avons déjà fait mention dans le chapitre traitant des Nombres. 
Ainsi, avec ces axiomes il est possible de démontrer qu'il existe (existence) une et une seule application 
(unicité), notée "x" ou plus souvent de NxM dans N vérifiant: 

fVw e N,« ■ 0 = 0 

< (3.57) 

1 Vp e N,Vq e N,p (q + V)- p q+p 


r~ ^ 

Remarque: Ce site n'ayant pas pour vocation de s'adresser à des mathématiciens, nous nous 
passerons de la démonstration (relativement longue) et admettrons intuitivement que l'application " 
x " existe et est unique... 

^ _ : _ / 

La puissance est une notation particulière d'un cas précis de multiplications. Lorsque le(s) 
multiplicateur(s) et multiplicande(s) sont identique(s) en valeur numérique, nous notons la 
multiplication (par exemple): 


«■ «■ «' n‘ w «■ «■ « = (3.58) 

c'est ce que nous nommons la "notation en puissance" ou "l'exponentiation". Le nombre en exposant 
est ce que nous nommons la "puissance" ou "l'exposant" du nombre (n en l'occurrence). La notation en 
exposants se trouve pour la première fois dans l'ouvrage de Chuquet intitulé "Triparty en la science des 
nombres" (1484). 

Vous pouvez vérifier par vous-même que ses propriétés sont les suivantes (par exemple): 

»'■*'= (3-59) 

Voici quelques propriétés intuitives que nous admettrons sans démonstrations de l'opération de 
multiplication: 

PL La multiplication de plusieurs nombres ne dépend pas de l'ordre des termes. Nous disons alors que 
la multiplication est une "opération commutative". 

P2. La multiplication de plusieurs nombres ne change pas si nous remplaçons deux ou plusieurs d'entre 
eux par leur résultat intermédiaire. Nous disons alors que la multiplication est "opération associative". 

P3. L'unité est l'élément neutre de la multiplication car tout multiplicande multiplié par le multiplicateur 
1 est égal au multiplicande. 

P4. La multiplication peut comporter un terme de telle façon à ce que le produit soit égal à l'unité 
(l'élément neutre). Nous disons alors qu'il existe un "inverse pour la multiplication" (mais cela dépend 
rigoureusement dans quel ensemble de nombres nous travaillons). 

P5. La multiplication est "distributive", c'est-à-dire que: 


a‘ (b + c) = ab+ac (3.60) 


l'opération inverse s'appelant la "factorisation". 

Introduisons encore quelques notations particulières relatives à la multiplication: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


134/4839 










Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

1. Soient x lr x s des nombres quelconques (non nécessairement égaux) alors nous pouvons noter le 
produit ainsi: 



(3.61) 


en définissant des bornes supérieure et inférieure au produit indexé (au-dessus et en-dessous de la lettre 
grecque majuscule "Pi"). 


Rappel des propriétés relatives à cette notation: 


pour tout nombre k tel que: 


n** =*" ru 


1=1 


2=1 


(3.62) 


B 

j~[ k = k* (3.63) 
i-1 


Nous avons aussi par exemple: 

B 

ne* + y) = ( x + ?y (3 - 64) 

2. Nous définissons également la "factorielle" simplement (car il existe aussi une manière complexe de 
la définir en passant par la fonction Gamma d'Euler comme cela est fait dans le chapitre de Calcul 
Différentiel Et Intégral) par: 


1-2-34. ..-» = »! 


Exemples: 

Voyons quelques exemples simples de multiplications élémentaires. La multiplication de deux nombres 
relativement petits est assez facile dès que nous avons appris par coeur à compter jusqu'à au moins le 
nombre résultant de cette opération. Ainsi: 

5 10 1014 

x 2 _ , x 3 , x 3 (3.66) 

= 10 = 30 = 3042 

Pour les beaucoup plus grands nombres il faut adopter une autre méthode qu'il s'agit d'apprendre par 
coeur. Ainsi par exemple: 


4574 

X 8 (3.67) 

= ? 

nous multiplions colonne par colonne et nous additionnons l'ensemble des résultats décalés d'un chiffre 
comme ci-dessous (8x4=32, 8x7=56, 8x5=40, 8x4=32) ainsi nous obtenons: 

[Vincent ISOZ] | http://www.sciences.ch] | Page: 


135/4839 












Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


4574 
x 3 
32 ~ 

56 (3.68) 

40 

32 

36592 

Cette méthodologie est très logique si vous avez bien compris comment nous construisons un chiffre en 
base dix. Ainsi, nous avons (nous supposerons pour l'instant la distributivité comme connue): 

8'4574 = 8'(4000+ 500+70+ 4) = 8 ■ (4 ■ 10 3 + 5 ■ 10 2 + 7 ■ 10 1 + 4'10°) 

= (3 ■ 4 ■ 10 3 ) + (3 ■ 5 ■ 10 2 ) + S ■ (7 ■ 10 1 ) + (S ■ 4 ■ 10°) ( 3 - 69 ) 

= 32'000 + 4'000 + 560 + 32 = 36'592 

Pour ne pas surcharger l'écriture dans la multiplication par la méthode "verticale", nous ne représentons 
pas les zéros qui surchargeraient inutilement les calculs (et ce d'autant plus si le multiplicateur et/ou le 
multiplicande sont de très grands nombres). 

2.4. DIVISION 


Définition: La division de nombres entiers (pour commencer par le cas le plus simple...) est une 
opération, qui a pour but, étant donné deux nombres entiers, l'un appelé "dividende", l'autre appelé 
"diviseur", d'en trouver un troisième appelé "quotient" qui soit le plus grand nombre dont le produit par 
le diviseur puisse se retrancher (donc la division découle de la soustraction!) du dividende (la différence 
étant nommée le "reste" ou la "congruence"). 


Ç 

Remarque: Dans les cas des nombre réels il n'y a jamais de reste à la fin de l'opération de division 
(car le quotient multiplié par le diviseur donne exactement le dividende)! 

V___ 

D'une façon générale dans le cadre des nombres entiers, si nous notons D le dividende, d le diviseur, Q 
le quotient et R le reste nous avons la relation: 


D = Q-d + R 


(3.70) 


en sachant que la division était initialement notée de la manière suivante: 


D\d= — (3.71) 
d 


Nous désignons également souvent par "fraction" (au lieu de "quotient"), le rapport de deux nombres 
ou autrement dit, la division du premier par le deuxième. 


Remarque: Le signe de la division ":" est dû à Leibniz. La barre de fraction se trouve elle pour la 
première fois dans les ouvrages de Fibonacci (1202) et elle est probablement due aux Hindous. 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


136/4839 
























Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

Si nous divisons deux nombres entiers et que nous souhaitons un entier comme quotient et comme reste 
(s'il y en a un...), alors nous parlons de "division euclidienne". 

Nous indiquons l'opération en plaçant entre les deux nombres, le dividende et le diviseur un " ou une 
barre de division " / ". 

Si nous avons: 


D :d = D • — = D‘i, 
d 


(3.72) 


nous appelons i D l'inverse du dividende. A tout nombre est associé un inverse qui satisfait cette 
condition. 


De cette définition il vient la notation (avec x étant un nombre quelconque différent de zéro): 


— = X 1 ' X 1 = X 1 1 = X° =1 (3.73) 

X 

Dans le cas de deux nombres fractionnaires, nous disons qu'ils sont "inverses" ou "réciproques", lorsque 
leur produit est égal à l'unité (comme la relation précédente) pour toute valeur de x, positive ou 
négative. 

- 

Remarques: 

RI. Une division par zéro est ce que nous nommons une "singularité". C'est-à-dire que le résultat de 
la division est indéterminé. 

R2. Lorsque nous multiplions le dividende et le diviseur d'une division (fraction) par un même 
nombre, le quotient ne change pas (il s'agit d'une fraction équivalente), mais le reste est multiplié 
par ce nombre. 

R3. Diviser un nombre par un produit effectué de plusieurs facteurs revient à diviser ce nombre 
successivement par chacun des facteurs du produit et réciproquement. 

_ J 

Les propriétés des divisions avec les notations condensées de puissances (exponentiation) sont les 
suivantes (nous laisserons le soin au lecteur de le vérifier avec des valeurs numériques): 


x ■ x 1 x 

y y 


(3.74) 


ou: 


X ■ X ■ X X X . . 3-5 3-5 1 

- = — ■ — , x = l , l , x = x = x 3, x 2 = X 2 = x 1 = X (3.75) 

X ' X XX 

Rappelons qu'un nombre premier (entier relatif) est un nombre qui n'a d'autres diviseurs que lui-même 
et l'unité (rappelons que 1 n'est pas un nombre premier). Donc tout nombre qui n'est pas premier a au 
moins un nombre premier comme diviseur (excepté 1 par définition!). Le plus petit des diviseurs d'un 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


137/4839 













Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

nombre entier est donc un nombre premier (nous détaillerons les propriétés des nombres premiers 
relativement au sujet de la division dans le chapitre de Théorie des Nombres). 


Voyons quelques propriétés de la division (certaines nous sont déjà connues car elles découlent d'un 
raisonnement logique des propriétés de la multiplication): 


a c , , 

— = — <=> fl ■ fit = ô ■ c 

b d 


ad ad a 
bd bd b 


a 

b 


a -a a 


-b b b 
a c a+c 
b + b~^~ 
a c _ a ■ d+b ■ c 
b~d~ ~b~d 
a c a c 


bd bd 
a c ad ad 


bd b c bc 


(3.76) 


où la deuxième ligne est ce que nous appelons une "amplification des termes" et la cinquième ligne une 
" mis e au dénominateur commun". 


Nous avons aussi les propriétés suivantes: 

PI. La division de plusieurs nombres dépend de l'ordre des termes. Nous disons alors que la division est 
une "opération non-commutative". Ce qui signifie que nous avons quand A est différent de B: 


A B 
— ^ — 
B A 


(3.77) 


P2. Le résultat de la division de plusieurs nombres change si nous remplaçons deux ou plusieurs d'entre 
eux par leur résultat intermédiaire. Nous disons alors que la division est "opération non-associative": 



C 



(3.78) 


P3. L'unité est l'élément neutre à droite de la division car tout dividende divisé par le diviseur 1 est égal 
au dividende mais l'unité n'est par contre pas neutre à gauche. 

P4. La division peut comporter un terme de telle façon à ce que la division soit égale à l'unité (l'élément 
neutre). Nous disons alors qu'il existe un "symétrique pour la division". 

Si a et b sont deux nombres réels positifs et non nuis nous avons: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


138/4839 

















Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


a ? • a q = a p+q , — = a ¥_q => a q = — (3.79) 


• b p = {a • b) ¥ <=> — = ( —] 

UJ 


Nous pouvons maintenant définir la racine g-ième principale d'un nombre quelconque a: 


? *r ( 3 - 81 > 

a T = -va 


la dernière relation n'étant définie que pour q e N *. Au niveau de la terminologie, nous avons: 


ife (3-82) 


qui est une racine, le nombre a est le "radicande" et q est l'indice de la racine. Le symbole est 
appelé le "radical". 

De ce qui a déjà été dit pour les puissances, nous pouvons conclure aisément que: 


et: 


• y/E = Ija ' b 




(3.83) 


(a*)* -a” -(a*)' (3.84) 


il en ressort que: 



Nous avons également si a < 0 : 

= a ( 3 - 86 ) 

si q e N * est impair et: 

= |a| (3.87) 


si q e N * est pair. 

Si a < 0 et q e N * est impair, alors: 


est le nombre réel négatif b tel que: 



(3.88) 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


139/4839 







Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


b q = a (3-89) 


Si q e N *est pair alors bien sûr, comme nous l'avons déjà vu, la racine est complexe (cf. chapitre sur 
les Nombres). 


Si le dénominateur d'un quotient contient un facteur de la forme avec a * 0 , en multipliant le 


numérateur et le dénominateur par , nous supprimerons la racine au dénominateur, puisque: 



(3.90) 


Nous appelons communément ce procédé "rendre un dénominateur rationnel". Nous pouvons bien sûr 
faire de même avec le numérateur. 

Exemple: 

Voyons un exemple mondialement connu de l'application de la racine qui concerne l'origine des formats 
papier A6, A5, A4, A3, A2, Al, AO etc... 

Ce format a au fait la propriété (c'est un objectif à l'origine) de conserver ses proportions lorsque nous 
plions ou coupons la feuille en deux dans sa grande dimension. Ainsi, si nous appelons L la longueur et / 
la largeur de la feuille, nous avons: 



(3.91) 


Il en ressort que: 


L=^2l (3.92) 

Comme le format AO à par définition une superficie de 1 \m 2 . Pour ce format nous avons alors: 



Nous en déduisons donc: 



et donc: 


1 = 2“ 1/4 1 [m] = S4A [cm] (3.95) 


d'où nous tirons aussi: 


L = 2 1/4 1 [m] = 118.9 [cm] (3.96) 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


























Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

Les autres formats de déduisant donc pour rappel en divisant par deux la feuille dans sa grande 
dimension. 

3. POLYNÔMES ARITHMÉTIQUES 

Définition: Un "polynôme arithmétique" (à ne pas confondre avec les polynômes algébriques qui 
seront étudiés dans la section d'Algèbre) est un ensemble de nombres séparés les uns des autres par les 
opérations d'addition ou de soustraction (+ ou -). 

Les composants enfermés dans le polynôme sont appelés "termes" du polynôme. Lorsque le polynôme 
contient un unique terme, nous parlons alors de "monôme", s'il y a deux termes nous parlons de 
"binôme", et ainsi de suite... 

La valeur d'un polynôme arithmétique est égale à l'excès de la somme des termes précédés du signe + 
sur la somme des termes précédés du signe -. 

Démonstration: 


n - « 4 + - nç +...- +?% = 1 n + k 5 +... + «,■ \ + (-1) ■ ( n 2 +w 4 + n 6 +... + rç-.j ■ 

(3.97) 


quelles que soit les valeurs des termes. 


□C.Q.F.D. 

Mettre en évidence l'unité négative -1 est ce que nous appelons une "factorisation" ou "mise en 
facteurs". L'opération inverse, s'appelant une "distribution" ou "développement". 

Le produit de plusieurs polynômes peut toujours être remplacé par un polynôme unique que nous 
appelons le "produit effectué". Nous opérons habituellement comme suit: nous multiplions 
successivement tous les termes du premier polynôme, en commençant par la gauche, par le premier, le 
second,..., le dernier terme du second polynôme. Nous obtenons ainsi un premier produit partiel. Nous 
faisons, s'il y a lieu, la réduction des termes semblables. Nous multiplions ensuite chacun des termes du 
produit partiel successivement par le premier, le second,..., le dernier terme du troisième polynôme en 
commençant par la gauche et ainsi de suite. 

Le produit des polynômes A,B,C, ...L ,... est la somme de tous les produits de n facteurs formés avec un 
terme de A, un terme de B ,..., et un terme de L. S'il n'y a aucune réduction, le nombre de termes du 
produit est alors égal au produit des nombres de termes des facteurs. 

4. VALEUR ABSOLUE 


Un nombre réel est constitué de deux parties: un signe + ou - et une valeur absolue. 

Exemples: 

El. +7 est constitué du signe + et de la valeur absolue 7 
E2. -5 est constitué du signe - et de la valeur absolue 5 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


141/4839 








Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

La valeur absolue de +7 est donc 7, la valeur absolue de -5 est donc 5. 

Définition: Pour tout nombre réel x, la "valeur absolue" de x, notée |x| est donnée par: 



(3.98) 


Nous remarquons que: 


x = max(-x, x) (3.99) 


Ainsi que les expressions équivalentes: 


et: 


x< x (3.100) 


-x = x (3.101) 


et encore: 


x < y <=> -y < x < y 

i w (3102) 

|x| > y x < -y\{ xly 

ces dernières étant souvent utilisées dans le cadre de la résolution des inéquations. 

Indiquons qu'il est aussi utile d'interpréter l'expression |x- y\ comme la distance entre les deux 

nombres x et y sur la droite réelle. Ainsi, en munissant l'ensemble des nombres réels de la distance 
valeur absolue, il devient un espace métrique. 

La résolution d'une inéquation telle que |x- 3| < 9 se résout alors simplement à l'aide de la notion de 

distance. La solution est l'ensemble des réels dont la distance au réel 3 est inférieure ou égale à 9. C'est 
l'intervalle de centre 3 et de rayon 9 ou autrement écrit: 

[3- 9,3 + 9] = [-6,12] (3.103) 

La valeur absolue a quelques propriétés triviales que nous énoncerons sans démonstrations: 

Pl. La valeur absolue de la somme algébrique de plusieurs nombres réels est inférieure ou égale à la 
somme des valeurs absolues des composantes de la somme: 

|x + j/|<|x| + |y| (3.104) 

ce que les mathématiciens appellent parfois la "première inégalité triangulaire". 

P2. La valeur absolue de la différence est supérieure ou égale à la valeur absolue de la différence des 
valeurs absolues des composantes de la différence: 

[Vincent ISOZ] | http://www.sciences.ch] | Page: 


142/4839 







Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 




(3.105) 


ce que les mathématiciens appellent parfois la "deuxième inégalité triangulaire". 

P3. La valeur absolue du produit (multiplication) est égale au produit des valeurs absolues: 

k = c 3 - 106 ) 

P4. La valeur absolue du rapport est égale au rapport des valeurs absolues: 


= fn (3.107) 

M 


5. REGLES DE CALCUL 


Fréquemment en informatique (dans le développement en particulier), nous parlons de "priorité des 
opérateurs". En mathématiques nous parlons de "priorité des ensembles d'opérations et des règles des 
signes". De quoi s'agit-il exactement? 

Nous avons déjà vu quelles étaient les propriétés des opérations d'addition, soustraction, multiplication, 
mise en puissance et division. Nous tenons donc à ce que le lecteur différencie la notion de "propriété" 
de celle de "priorité" (que nous allons tout de suite voir) qui sont deux notions complètement 
différentes! 

En mathématiques, en particulier, nous définissons les priorités des symboles: {[()]} 

Autrement dit: 

1. Les opérations qui sont entre parenthèses ( ) doivent être effectuées en premier dans le polynôme. 

2. Les opérations qui sont entre crochets [ ] doivent être effectuées en second à partir des résultats 
obtenus des opérations qui se trouvaient entre les parenthèses ( ). 

3. Finalement, à partir des résultats intermédiaires des opérations qui se trouvaient entre parenthèses ( ) 
et crochets [ ], nous calculons les opérations qui se situent entre les accolades { }. 

Faisons un exemple, ceci sera plus parlant. 

Exemple: 

Soit à calculer le polynôme: 

{ [5 ■ (8 + 2) + 3 ■ [4 + (8 + 6 ) ■ 2]] ■ (1 + 9)} ■ 7 +1 (3.108) 

Selon les règles que nous avons définies tout à l'heure, nous calculons d'abord tous les éléments qui sont 
entre parenthèses ( ), c'est-à-dire: 

(8 + 2) = 10, (8+ 6) =14, (1 + 9) = 10 (3.109) 


ce qui nous donne: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


143/4839 









Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

{[5 ■ 10 + 3 ■ [4 + 14 ■ 2]]-10) ■ 7 +1 (3.110) 

Toujours selon le règles que nous avons définies tout à l'heure, nous calculons maintenant tous les 
éléments entre crochets en commençant toujours à calculer les termes qui sont dans les crochets [ ] au 
plus bas niveau des autres crochets [ ]. Ainsi, nous commençons par calculer l'expression [4 +14 ■ 2] qui 
se trouve dans le crochet de niveau supérieur: [5 ■ 10 + 3 ■.]. 

Cela nous donne [4 +14 ■ 2] = 32 et donc: 

{[5'10 + 3'32]' 10} '7 + 1 (3.111) 

Il nous reste à calculer maintenant [510 + 3- 32] = 146 et donc: 

{146-10}-7 + 1 (3.112) 

Nous calculons maintenant l'unique terme entre accolades, ce qui nous donne: 

{146 T0} = 1460 (3.113) 


Finalement il nous reste: 


1460 ■ 7 + 1 = 10'221 (3.114) 

Evidemment il s'agit d'un cas particulier... Mais le principe est toujours le même. 

La priorité des opérateurs arithmétiques est une notion spécifique aux langages informatiques (comme 
nous en avons déjà fait mention) du fait qu'on ne peut dans ces derniers écrire des relations 
mathématiques que sur une ligne unique. 

Ainsi, en informatique l'expression: 


-cr(b+cy 


g 


(3.115) 


s'écrit (à peu de choses près): 


-a *(£ + c) Se A /- g (3.116) 


Un non-initié pourrait y lire: 

-a'(b + c') d 


\ ~a ■ (b + c) 1 

- g ou 1- 1 ;J -g ou< 


[-a- (è + c)f 


-g (3.117) 


[ ~a • (b + c)]7 - g 

et encore quelques autres... ce qui vous en conviendrez, est fort dangereux car nous arriverons à des 
résultats différents à chaque fois (cas particuliers mis à part...) ! 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


144/4839 












Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

Ainsi, il a logiquement été défini un ordre de priorité des opérandes tel que les opérations soient 
effectuées dans l'ordre suivant: 

1. - Négation 

2. A Puissance 

3. * / Multiplication et division 

4. \ division entière (spécifique à l'informatique) 

5. Mod Modulo (cf. chapitre de Théorie Des Nombres) 

6. + - Addition et soustraction 

Evidemment les règles des parenthèses ( ), crochets [ ], et accolades { } qui ont été définies en 
mathématiques s'appliquent à l'informatique. 

Ainsi, nous obtenons dans l'ordre (nous remplaçons chaque opération effectuée par un symbole): 
D'abord les termes entre parenthèses: 

-a*(è+c) A ü(/e A /-g = -üs*cy A üf/e A /-g (3.119) 

Ensuite les règles de priorité des opérateurs s'appliquent dans l'ordre défini précédemment: 
D'abord la négation (1): 

-a *<2 a ü? le A /-g = a ü? le A /-g (3.120) 

ensuite la puissance (2): 

j5*a^d!e A /-g = fi* g (3.121) 

nous appliquons la multiplication (3): 


et finalement la division (3): 


jS*Z/S - g = e/ ô- g (3.122) 


E(ô-g = $-g (3.123) 


Les règles (4) et (5) ne s'appliquent pas à cet exemple particulier. 
Finalement (6): 

$-g=<p (3.124) 


Ainsi, en suivant ces règles, ni l'ordinateur, ni l'être humain ne peuvent (ne devraient) se tromper lors de 
l'interprétation d'une équation écrite sur une ligne unique. 

En informatique, il existe cependant plusieurs opérateurs que nous ne retrouvons pas en mathématiques 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


145/4839 






Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

et qui changent souvent de propriétés d'un langage informatique à un autre. Nous ne nous attarderons 
pas trop là-dessus cependant, nous avons mis ci-dessous un petit descriptif: 

L'opérateur de concaténation " & " est évalué avant les opérateurs de comparaisons. 

Les opérateurs de comparaison (=, <, >, •• .) possèdent tous une priorité identique. 

Cependant, les opérateurs les plus à gauche dans une expression, détiennent une priorité plus élevée. 

Les opérateurs logiques sont évalués dans l'ordre de priorité suivant: 

1. Not - 2. And - 3. Or - 4. Xor - 5. Eqv - 6 . Imp 


Maintenant que nous avons vu les priorités des opérateurs, quelles sont les règles des signes en vigueur 
en mathématiques? 

D'abord, il faut savoir que ces dernières ne s'appliquent que dans le cas de la multiplication et de la 
division. Soient deux nombres positifs (+x), (+ 7 ). Nous avons: 


(+x)‘(+y)=(+x)‘(+y)=+(*'y) (3.125) 

Autrement dit, la multiplication de deux nombres positifs est un nombre positif et ceci est généralisable 
à la multiplication de n nombres positifs. 

Nous avons: 


(-*) ■ (+y) = (+x) ■ (~y) = ~(x ■ y) (3.126) 

Autrement dit, la multiplication d'un nombre positif par un nombre négatif est négative. Ce qui est 
généralisable à un résultat positif de la multiplication s'il y a un nombre pair de nombres négatifs et à un 
résultat négatif pour un nombre impair de nombres négatifs sur la totalité n des nombres de la 
multiplication. 

Nous avons: 


(-*) ' (ry) = (-*) ' (- 7 ) = + (* ' y) ( 3 . 127 ) 

Autrement dit, la multiplication de deux nombres négatifs est positive. Ce qui est généralisable à un 
résultat positif de la multiplication s'il y a un nombre pair de nombre négatifs et à un résultat négatif 
pour un nombre impair de nombres négatifs. 

Pour ce qui est des divisions, le raisonnement est identique: 

(+x)!(+y) = +(xiy) et (+y)f(+x) = +{y! x) (3.128) 

Autrement dit, si le numérateur et le dénominateur sont positifs, alors le résultat de la division sera 
positif. 

Nous avons: 


(+x)i{~y) ={~x)!{+y) = -{xiy) et (~ÿ)i(+x) = (+y)f(~x) = ~(y/x) (3.129) 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


146/4839 






Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

Autrement dit, si soit le numérateur ou le dénominateur est négatif, alors le résultat de la division sera 
forcément négatif. 

Nous avons: 

= + (*f y) et (-y)t(-x) -+(ytx) (3.130) 

Autrement dit, si le numérateur et le dénominateur sont positifs, alors le résultat de la division, sera 
forcément positif. 

Evidemment, si nous avons une soustraction de termes, il est possible de la réécrire sous la forme: 

x-y = x + (~î)y = ~\'(~x+y) (3.131) 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


147/4839 






Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 



[Vincent ISOZ] | http://www.sciences.ch] | Page: 


148/4839 






















































































Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


149/4839 






















































































Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


150/4839 






















































































Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


151/4839 






















































































Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


4. THÉORIE DES NOMBRES 


T 

X raditionnellement, la théorie des nombres est une branche des mathématiques qui s'occupe des 

propriétés des nombres entiers, qu'ils soient entiers naturels ou entiers relatifs. Plus généralement, le 
champ d'étude de cette théorie concerne une large classe de problèmes qui proviennent naturellement 
de l'étude des entiers. La théorie des nombres peut être divisée en plusieurs branches d'étude (théorie 
algébrique des nombres, théorie calculatoire des nombres, etc.) en fonction des méthodes utilisées et 
des questions traitées. 



Nous avons choisi de ne présenter dans cet exposé que les sujets qui sont indispensables à l'étude de la 
mathématique et de la physique théorique ainsi que ceux devant faire absolument partie de la culture 
générale de l'ingénieur. 

1. PRINCIPE DU BON ORDRE 


Nous tiendrons pour acquit ce principe qui dit que tout ensemble non vide S c N contient un plus petit 
élément. 

Nous pouvons utiliser ce théorème pour démontrer une propriété importante des nombres appelée 
"propriété archimédienne" ou "axiome d'Archimède" qui s'énonce ainsi: 

Pour Va, b e N où a est non nul, il existe au moins un entier positif n tel que: 

« ■ a 1b (4.1) 

En d'autres termes, pour deux grandeurs inégales, il existe toujours un multiple entier de la plus petite, 
supérieur à la plus grande. Nous appelons "archimédiennes" des structures dont les éléments vérifient 
une propriété comparable (cf. chapitre de Théorie Des Ensembles). 

Même si cela est trivial à comprendre faisons la démonstration car elle permet de voir le type de 
démarches utilisées par les mathématiciens quand ils doivent démontrer des éléments triviaux de ce 
genre... 

Démonstration: 

Supposons le contraire en disant que pour Vn e N nous avons: 

n ' a < b (4.2) 

Si nous démontrons que cela est absurde pour tout n alors nous aurons démontré la propriété 
archimédienne. 

Considérons alors l'ensemble: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


152/4839 














Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

£ = {ù-rtt2|«eN} (4.3) 

En utilisant le principe du bon ordre, nous en déduisons qu'il existe s 0 e S tel que s 0 < s pour tout 
se. S - Posons donc que ce plus petit élément est: 

s 0 =b~ n 0 a (4.4) 


et nous avons donc aussi: 


b - + l)a e S (4.5) 

Comme par hypothèse n ■ a < b nous devons alors avoir: 

b - (;% + î)a > b - n 0 a (4.6) 

et si nous réarrangeons et simplifions: 

-(m 0 +1)>— «0 (4.7) 


et que nous simplifions le signe négatif nous devions donc avoir...: 

«o + 1 - «b l 4 - 8 ) 

d'où une contradiction évidente! 

Cette contradiction amène que l'hypothèse initiale comme quoi « ■ a < b pour tout n alors est fausse et 
donc que la propriété archimédienne est démontrée par l'absurde. 

□C.Q.F.D. 


2, PRINCIPE D'INDUCTION 


Soit S un ensemble de nombres naturels qui possède les deux propriétés suivantes: 
PI. le£ 

P2. Si ieS.alors i+leS 
Alors: 


£=N\{0} = N* (4.9) 

Nous construisons ainsi l'ensemble des nombres naturels (se référer au chapitre de Théorie des 
Ensembles pour voir la construction rigoureuse de l'ensemble des nombres entiers avec les axiomes de 
Zermelo-Fraenkel). 

Soit maintenant: 


B = N*\S ( 41 °) 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


153/4839 







Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

le symbole " \ " signifiant "excluant". Nous voulons démontrer que: 

B = 0 (4.11) 

A nouveau, même si cela est trivial à comprendre faisons la démonstration car elle permet de voir le 
type de démarches utilisées par les mathématiciens quand ils doivent démontrer des éléments triviaux 
de ce genre... 

Démonstration: 

Supposons le contraire, c'est-à-dire: 


(4.12) 

Par le principe du bon ordre, puisque B <z N, B doit posséder un plus petit élément que nous noterons 

V 

Mais puisque 1 e S de par (PI), nous avons que £ 0 > 1 et bien évidemment aussi que 1 £ B , c'est- 
à-dire aussi h (i -1 e S . En faisant appel à (P2), nous avons finalement que h (i e S , c'est-à-dire que 
ù 0 £ B , donc une contradiction. 


□C.Q.F.D. 


Exemple: 

Nous souhaitons montrer à l'aide du principe d'induction, que la somme des n premiers carrés est égale 
à n{n + 1)(2« + 1) / 6, c'est-à-dire que pour n > 1 nous aurions (cf. chapitre de Suites Et Séries): 


12^02^ _»(» + l)(2»+l) 


r +2 J + ... + ^ 


6 


(4.13) 


D'abord la relation ci-dessus est facilement vérifiée pour n = 1 nous allons montrer que n = k + 1 
vérifie aussi cette relation. En vertu de l'hypothèse d'induction: 


^2 ,2 h V 2 + 1)(2j£ + 1) ,, 1V 2 

l 2 + t + ... + kr + (it +1) = —^---- + (k + 1) 2 

6 

_ (i + l)(it + 2)(2t + 3) 

6 


(4.14) 


nous retrouvons bien l'hypothèse de la validité de la première relation mais avec « = k + 1, d'où le 
résultat. 


nC.Q.F.D. 

Ce procédé de démonstration est donc d'une très grande importance dans l'étude de l'arithmétique; 
souvent l'observation et l'induction ont permis de soupçonner des lois qu'il eût été plus difficile de 
trouver par a priori. Nous nous rendons compte de l'exactitude des formules par la méthode précédente 
qui a donné naissance à l'algèbre moderne par les études de Fermât et de Pascal sur le triangle de 
Pascal (voir la section d'Algèbre) 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


154/4839 









Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

3. DIVISIBILITÉ 

Définition: Soit A, B e Z avec A* 0 • Nous disons que " A divise B (sans reste)" s'il existe un entier q 
(le quotient) tel que: 

B = A-q (4.15) 


auquel cas nous écrivons: 


A\B (4.16) 

Dans le cas contraire, nous écrivons A \ B et nous lisons "A ne divise pas B". 

r~ -ï 

Remarques: 

1. Se rappeler que le symbole | est une relation alors que le symbole / est une opération! 

2. Il ne faut pas confondre l'expression "A divise B" qui signifie que le reste est obligatoirement nul 
et "A est le diviseur de la division de B" qui indique que le reste n'est pas forcément nul! 

S___J 

Par ailleurs, si A\B, nous dirons aussi que "B est divisible par A" ou que "B est un multiple de A 
Dans le cas où A\B et que 1 < A < B , nous dirons que A est un "diviseur propre" de B. 

De plus, il est clair que A\0 quel que soit Ae Z \ {0} sinon quoi nous avons une singularité. 

Voici maintenant quelques théorèmes élémentaires se rattachant à la divisibilité: 

Tl. Si A\B, alors A\BC quel que soit Ce Z 
Démonstration: 

Si A\B, alors il existe un entier q tel que B = Aq . Alors, BC = A(qC) et ainsi A\BC. 


nC.Q.F.D. 


T2. Si A\B et B\C, alors A\C. 

Démonstration: 

Si et B\C, alors il existe des entiers q et r tels que B = Aq et C = Br ■ Donc, C = A(qr) et ainsi A\C. 

□C.Q.F.D. 


T3. Si^|5 et^4|C, alors: 


A | (Bx + Cy ), Vx, ye Z (4.17) 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


155/4839 














Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

Démonstration: 

Si A\B et A\C, alors il existe des entiers q et r tels que B = Aq et C = Ar ■ H s'ensuit que: 

Bx + Cy = (Aq) x + (Ar)y = A(qx + ry) (4.18) 
et ainsi que A \ (Bx + Cy) Vx,ye Z . 


□C.Q.RD. 


T4. Si A\B et B\A, alors A= ±B 

Démonstration: 

Si A\B et B\A, alors il existe des entiers q et r tels que B = Aq et A= Br ■ Nous avons donc B = B(qr) 
et ainsi qr = 1 ; c'est pourquoi nous pouvons avoir q = ±1 si r = ±1 et qu'ainsi A = ±B 


nC.Q.F.D. 


T5. Si^4|2? et B * 0 alors |j 4| < |i?| 

Démonstration: 

Si A\B et B * 0, alors il existe un entier q * 0 tel que B = Aq . Mais alors, |£?| = I^H^I > \A\ , puisque 

kUi- 


□C.Q.F.D. 


3.1. DIVISION EUCLIDIENNE 


La division euclidienne est une opération qui, à deux entiers naturels appelés dividende et diviseur, 
associe deux entiers appelés quotient et reste. Initialement définie aux entiers naturels non nuis, elle se 
généralise aux entiers relatifs et aux polynômes, par exemple. 

Définition: Nous appelons "division euclidienne" ou "division entière" de deux nombres A et B 
l'opération consistant à diviser B par A en s'arrêtant quand le reste devient strictement inférieur à A. 

Rappelons (cf. chapitre Nombres) que tout nombre qui admet exactement les deux diviseurs euclidiens 
(dont la division donne un reste nul) que sont 1 et lui-même est dit "nombre premier" (ce qui exclut le 
nombre 1 de la liste des nombres premiers) et que tout couple de nombres qui n'ont que 1 comme 
diviseur euclidien commun sont dits "premiers entre eux". 

Soient A,BeZ avec A > 0• Le "théorème de la division euclidienne" affirme qu'il existe des entiers 
uniques q et r tels que: 


B = Aq+r<=>r = B~Aq (4.19) 


où 0 < r < A ■ De plus, si A \ B , alors 0 < r < A ■ 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


156/4839 







Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


Démonstration: 

Considérons l'ensemble: 


S = {V = B - qA | q, B e Z, A e Z* ,B - qA > oj (4.20) 

Il est relativement facile de voir que £ c Nu{0} et que S ^ 0 , d'où, d'après le principe du bon ordre, 
nous concluons que S contient un plus petit élément r > 0 ■ 

Soit q l'entier satisfaisant donc à: 


r=B~Aq (4.21) 

Nous voulons d'abord montrer que r < A en supposant le contraire (démonstration par l'absurde), c'est- 
à-dire que r > A ■ Alors, dans ce cas, nous avons: 

B - qA = r > A (4.22) 


ce qui est équivalent à: 


B - (q + 1)j4 = r - A 1 0 (4.23) 

mais B ~(q + 1)j 4 e S et: 

B - (q + Î>A < B - qA (4.24) 


ce qui contredit le fait que: 


r = B-qA (4.25) 


est le plus petit élément de S. Donc, r < A • Enfin, il est clair que si r = 0 , nous avons A\B, d'où la 
seconde affirmation du théorème. 


□C.Q.F.D. 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


157/4839 






Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

~~ " 

Remarque: Dans l'énoncé de la division euclidienne, nous avons supposé que A > 0 • 
Qu'obtenons-nous lorsque A < 0 ? Dans cette situation, -A est positif, et alors nous pouvons 
appliquer la division euclidienne à B et -A. Par conséquent, il existe des entiers q et r tels que: 

B = q(~A) + r où 0 < r < |j4| (4.26) 

Or, cette relation peut s'écrire: 

B = ~q(A) + r (4.27) 

où bien sûr, -q est un entier. La conclusion est que la division euclidienne peut s'énoncer sous la 
forme plus générale: 

Soient A, B e Z, alors il existe des entiers q et r tels que: 

B = Aq+r (4.28) 

où 0 < r < |j 4| . De plus, si A \ B , alors 0 < r < |j4| . 

k_> 

Les entiers q et r sont uniques dans la division euclidienne. En effet, s'il existe deux autres entiers q l et 
r-y tels que: 


B = Aqy + r x (4.29) 


avec toujours 0 < ry < A, alors: 


A(qy-q) = r~ry (4.30) 

et ainsi A \ (r - rç). En vertu de (T5) nous avons, si r - ^ ^ 0, |r - > A. 

Or, cette dernière inégalité est impossible puisque par construction -A < r - q < A. Donc, r =r x et, 
puisque A* 0 , alors q Y = q d'où l'unicité. 

3.1.1. PLUS GRAND COMMUN DIVISEUR 

Soit a,beZ tels que ah * 0 • Le "plus grand commun diviseur" (noté "PGCD" par la suite) de a et b, 
noté: 

(a, b) (4.31) 

est l'entier naturel d non nul qui satisfait aux deux propriétés suivantes: 

Pl. d\a et d\b (donc sans reste r dans la division!) 

P2. si c\a et c\b alors cLd et c\d (par définition!) 

Notons que 1 est toujours un diviseur commun de deux entiers arbitraires. 

[Vincent ISOZ] | http://www.sciences.ch] | Page: 


158/4839 











Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

Exemple: 

Considérons les entiers positifs 36 et 54. Un diviseur commun de 36 et 54 est un entier positif qui divise 
36, et aussi 54. Par exemple, 1 et 2 sont des diviseurs communs de 36 et 54. 

£^={1,2,3,4,6,9,12,18,36} 

, , (4.32) 

£^={1,2,3,6,9,18,27,54} 

Nous avons alors l'intersection représentée par le diagramme de Venn suivant: 



Figure: 4.1 - Diagramme de Venn des diviseurs communs 


avec l'ensemble des diviseurs communs suivant: 

Div^ n£ïv 54 = {1,2,3,6,9,18} (4.33) 


et donc le PGCD est: 


m ax {1,2,3,6,9,18} = 18 (4.34) 

et nous constatons que l'ensemble des diviseurs communs de 36 et 54 est aussi l'ensemble des 
diviseurs de 18. 

Cependant, il n'est pas forcément évident que le PGCD autre qu'unitaire (c'est-à-dire différent 1) de 
deux entiers a et b qui ne sont pas premiers entre eux existe toujours. Ce fait est démontré dans le 
théorème suivant (cependant, si le PGCD existe, il est de par sa définition unique!) dit "théorème de 
Bézout" qui permet aussi de démontrer d'autres propriétés intéressantes de deux nombres comme nous 
le verrons plus tard. 

Démonstration: 

Soient a,be Z tels que ab ^ 0 • Si d divise a et d divise b (pour les deux sans reste r\) il existe alors 
obligatoirement des entiers relatifs x et y tels que: 


d = (a,è) = ax +by 


(4.35) 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


159/4839 










Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

Cette relation est appelée "identité de Bézout" et il s'agit d'une équation diophantienne linéaire (cf. 

chapitre de Calcul Algébrique). 

Evidemment, si a et b sont premiers entre eux nous savons que d vaut alors 1. 

Pour démontrer l'identité de Bézout considérons d'abord l'ensemble: 

S = [d = ax +by | x,y e Z,ax + by > 0} (4.36) 

Comme S c N et S * 0 , nous pouvons utiliser le principe du bon ordre et conclure que S possède un 
plus petit élément d. Nous pouvons alors écrire: 

d =ax 0 + by 0 (4.37) 

pour un certain choix x (i j 0 eZ. Il suffit donc de montrer que d = (a, b) pour démontrer l'identité de 
Bézout! 

Procédons via une démonstration par l'absurde en posant supposant d \ a . Alors si c'est le cas, d'après 
la division euclidienne, il existe q,reZ tels que a = qd + r , où () < r < d • Mais alors: 

r = a - qd = a - q(axg + by 0 ) = a([ - qx 0 ) + b(-qy 0 ) (4.38) 

Ainsi, nous avons que r e S et r < d , ce qui contredit le fait que d est le plus petit élément possible de 
S. Donc nous avons démontré ainsi non seulement que d\a mais qu'en plus d existe toujours et, de la 
même façon, nous démontrons que d\b. 

Comme corollaire important montrons maintenant que si a,b e Z tels que ah ^ 0 , alors: 

S={ax + by\x,ye%} (4.39) 
constitue l'ensemble de tous les multiples de d = (a,b) : 

Comme d\a et d\b, alors nous avons forcément d \ ax+by pour tout x,y e Z. Soit M = {nd \ n e Z). 
Notre problème se réduit au fait à montrer que S = M • 

Soit d'abord s e S ce qui signifie que d\s et qui implique se M ■ 

Soit un me. M , cela voudrait donc dire que m = nd pour un certain n e Z • 

Comme d = ax 0 + hy f} pour un choix d'entiers quelconques x 0 ,y 0 e Z , alors: 

m = nd = n(ax 0 + by 0 ) = a(nx 0 ) +b{ny (i ) e S (4.40) 

□C.Q.F.D. 

Les hypothèses peuvent sembler compliquées mais portez plutôt votre attention un certain temps sur la 
dernière relation. Vous allez tout de suite comprendre! 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


160/4839 







Soit d = (a,b) et soit «eZ, alors nous avons les propriétés suivantes du PGCD: 


PI. (a,b + ma) = (a,b) = (a, ~b) 
P2. ( am,bm) = |/?s|(tï,ù) où m * 0 


P3. fi.*' 
\d d 


= 1 


P4. Si geZ\{0} tel que g\a et g\b alors 


a b 
g’ g 


~~U a - b) 


Dans certains ouvrages, ces quatre propriétés sont démontrées en utilisant intrinsèquement la propriété 
elle-même. Personnellement nous nous en abstiendrons car faire cela est plus ridicule qu'autre chose à 
notre goût car la propriété est une démonstration en elle-même. 


Elaborons maintenant une méthode (algorithme) qui s'avérera très importante pour calculer 
(déterminer) le plus grand commun diviseur de deux entiers (utile en informatique parfois). 


3.1.2. ALGORITHME D'EUCLIDE 


L'algorithme d'Euclide est un algorithme permettant donc de déterminer le plus grand commun diviseur 
de deux entiers. 


Pour aborder cette méthode de manière intuitive, il faut savoir que vous devez comprendre un nombre 
entier comme une longueur, un couple d'entiers comme un rectangle (côtés) et leur PGCD est la taille 
du plus grand carré permettant de carreler (paver) ce rectangle par définition (oui si vous réfléchissez 
un petit moment c'est assez logique!). 

L'algorithme décompose le rectangle initial en carrés, de plus en plus petits, par divisions euclidiennes 
successives, de la longueur par la largeur, puis de la largeur par le reste, jusqu'à un reste nul. Il faut bien 
comprendre cette démarche géométrique pour comprendre ensuite l'algorithme. 

Exemple: 

Considérons que nous cherchons le PGCD (a,b) où b vaut 21 et a vaut 15 et gardons à l'esprit que le 
PGCD, outre le fait qu'il divise a et b, doit laisser un reste nul! En d'autres termes il doit pouvoir diviser 
le reste de la division de b par a aussi! 

Nous avons donc le rectangle de 21 par 15 suivant: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


161/4839 











Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 



Figure: 4.2 - Première étape de l'algorithme PGCD 


D'abord nous regardons si 15 est le PGCD (on commence toujours par le plus petit). Nous divisons alors 
21 par 15 ce qui équivaut géométriquement à: 



Figure: 4.3 - Deuxième étape de l’algorithme PGCD 


15 n'est donc pas le PGCD (on s'en doutait...). Nous voyons immédiatement que nous n'arrivons pas à 
paver le rectangle avec un carré de 15 par 15. 


Nous avons donc un reste de 6 (rectangle de gauche). Le PGCD comme nous le savons doit, s'il existe, 
par définition pouvoir diviser ce reste et laisser un reste nul. 


Il nous reste donc un rectangle de 15 par 6. Nous cherchons donc maintenant à paver ce nouveau 
rectangle car nous savons que le PGCD est par construction inférieur ou égal à 6. Nous avons alors: 


Figure: 4.4 - Troisième étape de l'algorithme PGCD 

Et nous divisons donc 15 par le reste 6 (ce résultat sera inférieur à 6 et permet immédiatement de tester 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


162/4839 























































































































Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

si le reste sera le PGCD). Nous obtenons: 



Figure: 4.5 - Quatrième étape de l’algorithme PGCD 


A nouveau, nous n'arrivons pas à paver ce rectangle rien qu'avec des carrés. En d'autres termes, nous 
avons un reste non nul qui vaut 3. Soit un rectangle de 6 par 3. Nous cherchons donc maintenant à 
paver ce nouveau rectangle car nous savons que le PGCD est par construction inférieur ou égal à 3 et 
qu'il laissera un reste nul s'il existe. Nous avons alors géométriquement: 


I I I I I 

I “ 1 I !" - I 


Figure: 4.6 - Cinquième étape de l'algorithme PGCD 

Nous divisons 6 par 3 (ce qui sera inférieur à 3 et permet immédiatement de tester si le reste sera le 
PGCD): 



Figure: 4.7 - Sixième et dernière étape de l'algorithme PGCD 


et c'est tout bon! Nous avons 3 qui laisse donc un reste nul et divise le reste 6 il s'agit donc du PGCD. 
Nous avons donc au final: 



Figure: 4.8 - Résumé de l'algorithme PGCD 


Maintenant, voyons l'approche formelle équivalente: 


Soient a,b e Z, où a > 0 • En appliquant successivement la division euclidienne (avec b>a), nous 
obtenons la suite d'équations: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


163/4839 













































































Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

b - aq j + /| 0 crç <a 

a = W2 +r 2 O<0<0 

r 1 =r 2 q 3 +r 3 0<r 3 <r 2 


0-2 = + 0 O < 0 < 0-1 

0-1 = O^'-fl 


(4.41) 


Si d = (a,b) , alors d = r,-. 

Sinon de manière plus formelle: 

Démonstration: 

Nous voulons d'abord montrer que = (ci,b). Or, d'après la propriété PI: 

(a,b + ma) = ( a,b ) = (a,~b) (4.42) 


nous avons: 

{a,b)= {a, r{) = , r 2 ) = ... = , r/) (4.43) 

Pour démontrer la deuxième propriété de l'algorithme d'Euclide, nous écrivons l'avant-dernière 
équation du système sous la forme: 

0 = 0-2 " “O'O-i (4 - 44) 

Or, en utilisant l'équation qui précède cette avant-dernière équation du système, nous avons: 

0 = 0-2 - ?j(0-3 "ïjr-iO-a) 

(4.45) 

= 0 + -2 + C"îj)0--3 

En continuant ce processus, nous arrivons à exprimer comme une combinaison linéaire de a et b. 

nC.Q.F.D. 

Exemple: 

Calculons le plus grand commun diviseur de (429,966) et exprimons ce nombre comme une 
combinaison linéaire de 429 et de 966. 

Nous appliquons bien évidemment l'algorithme d'Euclide: 

966 =429'2 + 108 
429 = 108 1 3 + 105 

(4.46) 

108 = 105-1 + 3 
105 = 3-35 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


164/4839 






Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

Nous en déduisons donc que: 


= d = (966,429) = 3 (4.47) 


et, de plus, que: 


3 = 108-105'1= 108-(429-103'3) = 108'4-429 
= (966-429'2)'4-429 = 966■ 4 -429 ■ 9 = 966■ 4 + 429■ (-9) 


Donc le PGCD est bien exprimé comme une combinaison linéaire de a et Z) et constitue à ce titre le 
PGCD. 


Définition: Nous disons que les entiers a l ,a 7 ,...,a n sont "relativement premiers" ou "premiers entre 
eux" si: 


(a 1? a 2 ,...,a K ) = 1 (4.49) 

3.1.3. PLUS PETIT COMMUN MULTIPLE 

Définitions: 

D1. Soient flj , a 2 , .. ., a x e Z \ {0}, nous disons que m est un "commun multiple" de , a 2 ,..., a x si \ m 
pour i =1,2 

D2. Soient a x ,a 2 ,...,a K e Z \ {0}, nous appelons "plus petit commun multiple" (PPCM) de a x ,a 2 ,...,a s , 
noté: 


-] (4.50) 

le plus petit entier commun multiple positif à tous les communs multiples de a x ,a 7 ,...,a x . 

Exemple: 

Considérons les entiers positifs 3 et 5. Un multiple commun de 3 et 5 est un entier positif qui est à la 
fois un multiple de 3, et un multiple de 5. Autrement dit, qui est divisible par 3 et aussi par 5. Nous 
avons donc: 


M 3 ={3,6,9,12,15,18,21,24,27,30,...} 

(4.51) 

M 5 ={5,10,15,20,25,30,35,40,45,...} 


Nous avons alors l'intersection représentée par le diagramme de Venn suivant: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


165/4839 






Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 



Figure: 4.9 - Diagramme de Venn des communs multiples 

avec l'ensemble des communs multiples suivants: 


M 3 nM 5 = {15,30,45,60,...} (4.52) 


et le PPCM est alors: 


mm (15,30,45,60,...} = 15 (4.53) 


Nous constatons que l'ensemble des multiples communs de 3 et 5 est aussi l'ensemble des multiples de 
15. 



Voyons maintenant quelques théorèmes relatifs au PPCM: 

Tl. Si m est un commun multiple quelconque de ,..., a x alors c'est-à-dire que m 

divise chacun des üs ; . 

Démonstration: 

Soit M = [ûtj.flj ] . Alors, d'après la division euclidienne, il existe des entiers q et r tels que: 

m = qM + r, 0 < r < M (4.55) 

Il suffit de montrer que r = 0 • Supposons r * 0 (démonstration par l'absurde). Puisque \ m et | M 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


166/4839 















Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

, alors on a a i | r et cela pour i = 1,. Donc, r est un commun multiple de a x plus petit 

que le PPCM. On vient d'obtenir une contradiction, ce qui prouve le théorème. 


□C.Q.F.D. 


T2. Si k > 0 , alors [ka l ,ka 2 ,...,ka ll \ = k[a l7 a 2 ,...,a J 

La démonstration sera supposée évidente (dans le cas contraire contactez-nous et cela sera détaillé!) 
T3. [ a,b] • (a,b) =| ab \ 

Démonstration: 

Pour la démonstration, nous allons utiliser le "lemme d'Euclide" qui dit que si a\bc et (a,b) = 1 alors 

a\c. 

Effectivement cela se vérifie aisément car nous avons vu qu'il existe x,y e Z tels que 1 = ax+by et 
alors c = acx + bcy . Mais a\ac et a\bc impliquent que a | (acx + bcy ), c'est-à-dire également que a \ c . 

Revenons à notre théorème: 


Puisque (a, b) = (a, ~b) et [a, b] = [a, ~b ], il suffit de prouver le résultat pour des entiers positifs a et b. 
En tout premier lieu, considérons le cas où (a, b) = 1. L'entier [a,b] étant un multiple de a, nous 
pouvons écrire [et,b] = ma . Ainsi, nous avons b \ ma et, puisque (a, b) = 1, il s'ensuit, d'après le lemme 
d'Euclide, que b \ m. Donc, b < m et alors ab <am- Mais ab est un commun multiple de a et b qui ne 
peut être plus petit que le PPCM. c'est pourquoi ab = ma = [a,b]. 


Pour le cas général, c'est-à-dire (a,b) = d > 1, nous avons, d'après la propriété: 


î-j" “» 


et avec le résultat obtenu précédemment que: 


a b | a b 

d’d)~dd 

Lorsque nous multiplions des deux côtés de l'équation par ^ 
effectuée. 



(4.57) 

, le résultat suit et la démonstration est 


nC.Q.F.D. 


3.2. THÉORÈME FONDAMENTAL DE L'ARITHMÉTIQUE 

Le théorème fondamental de l'arithmétique dit que tout nombre naturel n > 1 peut s'écrire comme un 
produit de nombres premiers, et cette représentation est unique, à part l'ordre dans lequel les facteurs 
premiers sont disposés. 

Le théorème établit l'importance des nombres premiers. Essentiellement, ils sont les briques 

[Vincent ISOZ] | http://www.sciences.ch] | Page: 


167/4839 










Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

élémentaires de construction des entiers positifs, chaque entier positif contenant des nombres premiers 
d'une manière unique. 


Remarque: Ce théorème est parfois appelé "théorème de factorisation" (un peu à tort... car d'autres 
théorèmes portent le même nom...). 

___ J 

Démonstration: 

Si n est premier, et donc produit d'un unique entier premier, à savoir lui-même le résultat est vrai et la 
démonstration est terminée (dire qu'un nombre premier est produit de lui-même est bien évidemment un 
abus de langage!). Supposons que n n'est pas premier et donc strictement supérieur à 1 et considérons 
l'ensemble: 


D = {d | d | n et 1 < d < n) (4.58) 

Alors, D c N et, puisque n est composé, nous avons que D * 0 • D'après le principe du bon ordre, D 
possède un plus petit élément p 1 qui est premier, sans quoi le choix minimal de p 1 serait contredit. 
Nous pouvons donc écrire n = p x n v Si est premier, alors la preuve est terminée. Si « 1 est composé, 

alors nous répétons le même argument que précédemment et nous en déduisons l'existence d'un nombre 
premier p 2 et d'un entier n 2 < tels que n = p\p 2 n 2 . En poursuivant ainsi nous arrivons forcément à 

la conclusion que n k sera premier. 

Donc finalement nous avons bien démontré qu'un nombre quelconque est décomposable en facteurs de 
nombres premiers à l'aide du principe du bon ordre. 


□C.Q.F.D. 

Nous ne connaissons pas à ce jour de loi simple qui permette de calculer le n-ième facteur premier 
(p s ). Ainsi, pour savoir si un entier m est premier, il est pratiquement plus facile à ce jour de vérifier sa 

présence dans une table de nombres premiers. 

En fait, nous utilisons aujourd'hui la méthode suivante: 

Soit un nombre m, si nous voulons déterminer s'il est premier ou non, nous calculons s'il est divisible par 
les nombres premiers p K qui appartiennent à l'ensemble: 


[p„ e N | p n < (4. 


Exemple: 

L'entier 223 n'est ni divisible par 2, ni par 3, ni par 5, ni par 7, ni par 11, ni par 13. Il est inutile de 
continuer avec le prochain nombre premier, car y] 2 = 289 > 223 • Nous en déduisons dès lors que le 
nombre 223 est premier. 

3.3. CONGRUENCES 


Définition: Soit m e Z \ {0}. Si a et b ont même reste dans la division euclidienne par m nous disons 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


168/4839 












Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

que "a est congru à b modulo /«", et nous écrivons: 


a = b mod(wî) 


(4.60) 


ou de manière équivalente il existe un nombre entier relatif k tel que: 


b = a + km 


(4.61) 


Le lecteur pourra vérifier que cela impose que 

m\(a~b) (4.62) 

soit en français.... que m divise la différence entre a et b. Dans le cas contraire, nous disons que "a est 
non congru à b modulo m". 

Une autre manière de dire tout cela si ce n'est pas clair...: 

L'étude de ces propriétés qui relient trois nombres entre eux est appelée communément "l'arithmétique 
modulaire". 

c~ -^ 

Remarques: 

RL Que nous soyons bien d'accord, la congruence implique un reste nul pour la division ! 

R2. Nous excluons en plus de 0 aussi 1 et -1 pour les valeurs que peut prendre m dans la définition 
de la congruence dans certains ouvrages. 

R3. Derrière le terme de congruence se cachent des notions semblables mais de niveaux 
d'abstraction différents: 

- En arithmétique modulaire, nous disons donc que "deux entiers relatifs a et b sont congrus modulo 
m s'ils ont même reste dans la division euclidienne par m". Nous pouvons aussi dire qu'ils sont 
congrus modulo m si leur différence est un multiple de m. 

- Dans la mesure des angles orientés, nous disons que "deux mesures sont congrues modulo 
2n [rad] si et seulement si leur différence est un multiple de 2n [rad] ". Cela caractérise deux 
mesures d'un même angle (cf. chapitre de Trigonométrie). 

- En algèbre, nous parlons de congruence modulo I dans un anneau commutatif (cf. chapitre de 
Théorie Des Ensembles) dont / est un idéal: "x est congru à y modulo I si et seulement si leur 
différence appartient 7". Cette congruence est une relation d'équivalence, compatible avec les 
opérations d'addition et multiplication et permet de définir un anneau quotient de l'ensemble parent 
avec son idéal I. 

- Nous trouvons parfois, dans l'étude de la géométrie (cf. chapitre de Géométrie Euclidienne) le 
terme de congru mis à la place de semblable. Il s'agit alors d'une simple relation d'équivalence sur 
l'ensemble des figures planes. 


La relation de congruence = est une relation d'équivalence (cf. chapitre sur les Opérateurs), en d'autres 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


169/4839 













Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

termes , soient a,b,c,me.'L,m >1 alors la relation de congruence est: 
PL Réflexive: 


P2. Symétrique: 


P3. Transitive: 


a = a mod(m) (4.63) 


a = b mod(m) O b = a mod(wî) (4.64) 


a =b mod {ni),b =c mod(/7s) => a =c mod(m) (4.65) 


Démonstration: 

Les propriétés PI et P2 sont évidentes (si ce n'est pas le cas faites-le nous savoir nous développerons!). 
Nous démontrerons P3. Les hypothèses impliquent que b = a + hn,c = b + hn . Mais alors: 

c = b+lm = [a + hn) + lm = a + {k + i)m (4.66) 

ce qui montre que a et c sont congrus modulo m. 


nC.Q.F.D. 


La relation de congruence = est compatible avec la somme et le produit (se rappeler que la puissance 
n'est finalement qu'une extension du produit!). 

Effectivement, soient a,b,a',b'm,e Z,m > 1 tel que a =b mod(ra) et a 1 =b' mod(ra) alors: 

Pl. a + a ' = b +b' mod(m) 

P2. aa ' = bb ' mod(wn) 

Démonstrations: 

Nous avons: 

a = b + km,a 1 = b '+im (4.67) 


par hypothèse. Mais alors: 

a + a ' = b +b '+ Q + k)m (4.68) 
ce qui démontre Pl. Nous avons également: 

aa' = bb '+ blm + b 'hn + hnê = bb'+ sm 


ce qui démontre P2. 


□C.Q.F.D. 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


170/4839 






Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


Remarque: La relation de congruence se comporte sur de nombreux points comme la relation 
d'égalité. Néanmoins une propriété de la relation d'égalité n'est plus vraie pour celle de congruence, 
à savoir la simplification: si ab = ac mod(m ), nous n'avons pas nécessairement b = c mod(w). 


Exemple: 


2 ■ 1 = 2 ■ 3 mod(4) mais 1 w 3 mod(4) 

Jusqu'ici, nous avons vu des propriétés des congruences faisant intervenir un seul modulus. Nous allons 
maintenant étudier le comportement de la relation de congruence lors d'un changement de modulus. 

PI. Si a =b mod(/?s) et d\m, alors a = b mod(ü?) 

P2. Si a = b mod(r) et a = b mod(s) alors a et b sont congrus modulo [r,.?] 

Ces deux propriétés sont évidentes. Inutile d'aller dans les détails pour PL Pour P2, puisque b-a est un 
multiple de r et de 5 puisque par hypothèse: 

-—— = k, -— — = i => b ~ a = rk = si (4.70) 
r s 

b-a est donc un multiple du PPCM de r et s, ce qui démontre P2. 

De ces propriétés il vient que si nous désignons par/(x) un polynôme à coefficient entiers (positifs ou 
négatifs): 


/ (x) = Ax* + Bx*' 1 + Cx*~ 2 +... + Kx + L (4.71) 

La congruence a = b mod (m) donnera aussi / (a) = j (b) mod (m) . 

Si nous remplaçons x successivement par tous les nombres entiers dans un polynôme /(x) à coefficients 
entiers, et si nous prenons les résidus pour le module m, ces résidus se reproduisent de m en m (dans le 
sens où la congruence se vérifie), puisque nous avons, quel que soit l'entier m et x: 

f(x) = f(x + m) mod(ra) (4.72) 

Nous en déduisons alors l'impossibilité de résoudre la congruence suivante: 

f(x) = r mod(wî) (4.73) 

en nombres entiers, si r désigne l'un quelconque des non-résidus (un résidu qui ne satisfait pas la 
congruence). 

3.3.1. CLASSES DE CONGRUENCE 

Définition: Nous appelons "classe de congruence modulo m", le sous-ensemble de l'ensemble Z défini 
par la propriété que deux éléments a et b de Z sont dans la même classe si et seulement si 
a = b mod (m) ou qu'un ensemble d'éléments entre eux sont congrus par ce même modulo. 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


171/4839 













Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

r ; \ 

Remarque: Nous avons vu dans le chapitre traitant des opérateurs qu'il s'agit en fait d'une classe 
d'équivalence car la congruence modulo m est, comme nous l'avons démontré plus haut, une 
relation d'équivalence. 

^_ J 

Exemple: 


Soit m = 3 . Nous divisons l'ensemble des entiers en classes de congruence modulo 3. Exemple de trois 
ensembles dont tous les éléments sont congrus entre eux sans reste (observez bien ce que donne 
l'ensemble des classes!): 


0,3,6,9,12,...} 

{...,-3,-5,-2,1,4,7,10,13,...} (4.74) 

{...,-7,-4,-1,2,5,3,11,...} 


Ainsi, nous voyons que pour chaque couple d'élément d'une classe de congruence, la congruence 
modulo 3 existe. Cependant, nous voyons que nous ne pouvons pas prendre -9 = -8 mod(3) où -9 se 
trouve dans la première classe et -8 dans la seconde. 

Le plus petit nombre non négatif de la première classe est 0, celui de la deuxième est 1 et celui de la 
dernière est 2. Ainsi, nous noterons ces trois classes respectivement [0^ ,[l] 3 ,[2] î , le chiffre 3 en indice 

indiquant le modulus. 

Il est intéressant de noter que si nous prenons un nombre quelconque de la première classe et un 
nombre quelconque de la deuxième, alors leur somme est toujours dans la deuxième classe. Ceci se 
généralise et permet de définir une somme sur les classes modulo 3 en posant: 


Ainsi que: 


[0] 3 

+ [0t 

= [0] 3 

[0] 3 

+ ni 

-Pi 

[0] 3 

+ [2] 3 

= [2] 3 

Pi 

+ [1] 3 

= [2] 3 

Pi- 

K2] 3 = 

= [0] 3 

[2i 

+ [2] 3 

= m: 

[0i 

■ [0] 3 ■ 

-[0], 

[0] 3 

■Pi 1 

= [0] 3 

m 

' [2] 3 ■ 

= [0] 3 

Pis 

' Pi = 

■Pi 

nt 

m = 

= [2] 3 

[ 2 \ 

' [2] 3 

-Pi 


Ainsi, pour tout m > 1, la classe de congruence de: 


a mod(ra) (4.77) 


est l'ensemble des entiers congrus à a modulo m (et congrus entre eux modulo ni). Cette classe est 
notée: 


[al (4.78) 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


172/4839 














Définition: L'ensemble des classes de congruence [a\ K (qui forment par le fait que la congruence est 

une relation d'équivalence des: "classes d'équivalence"), pour un m fixe donne ce que nous appelons un 
"ensemble quotient" (cf. chapitre Opérateurs). Plus rigoureusement, nous parlons de "l'ensemble 
quotient de Z par la relation de congruence" dont les éléments sont les classes de congruence (ou: 
classes d'équivalence) et qui forment alors l'anneau z/ m’L . 

Nous déduisons de la définition les deux propriétés triviales suivantes: 

PL Le nombre b est dans la classe [a] m si et seulement si a = b mod(mi) 

P2. Les classes [a] m et [ù] M sont égales si et seulement si a = b mod(w3) 

Montrons maintenant qu'il y a exactement m différentes classes de congruence modulo m, à savoir 

Démonstration: 

Soit m > 1, alors tout nombre entier a est congru modulo m à un et un seul entier r de l'ensemble 
(0,1, 2,...,m - 1} (remarquez bien, c'est important, que nous nous restreignons aux entiers positifs ou 

nuis sans prendre en compte les négatifs!). De plus, cet entier r est exactement le reste de la division de 
a par m. En d'autres termes, si o < r < m , alors: 

a = r mod(m) (4.79) 

si et seulement si a = qm + r où q est le quotient de a par m et r le reste. La démonstration est donc 
une conséquence immédiate de la définition de la congruence et de la division euclidienne. 


□C.Q.F.D. 

Définition: Un entier b dans une classe de congruence modulo m est appelé "représentant de cette 
classe" (il est clair que par la relation d'équivalence que deux représentants d'une même classe sont 
donc congrus entre eux modulo m). 

Nous allons pouvoir maintenant définir une addition et une multiplication sur les classes de 
congruences. Pour définir la somme de deux classes [a] M ,[ù] M , il suffit de prendre un représentant de 

chaque classe, de faire leur somme et de prendre la classe de congruence du résultat. Ainsi (voir les 
exemples plus haut): 


[flL + [*L-[fl + *L ( 4 - 80 > 


et de même pour la multiplication: 


[ fl L'[ è ] M =[ flè L (4 - 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


173/4839 











Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

Par définition de la somme et du produit, nous constatons que la classe de 0 est l'élément neutre pour 
l'addition: 

[ fl L + [°L = [ a L Va e Z, e N (4.82) 
et la classe de l'entier 1 est l'élément neutre pour la multiplication: 

Va e Z, e N (4.83) 

Définition: Un élément [a] de s / mh est "une unité" s'il existe un élément [à] e Z/ m Z tel que 

Le théorème suivant permet de caractériser les classes modulo m qui sont des unités dans hi mh : 
Théorème: Soit [a] un élément de Z / mh ■ Alors [a] est une unité si et seulement si (a,m) = 1. 

Démonstration: 

Supposons d'abord que ( a,m ) = 1. Alors par Bézout, nous avons son identité: 

as + mr = 1 (4.84) 

Autrement dit, as est congru à 1 modulo m. Mais ceci est équivalent à écrire par définition que 

[a] [s] = [1] ce qui montre que [a] est une unité. Réciproquement, si [a] est une unité, ceci implique qu'il 

existe une classe [ 5 ] telle que [a] [s] = [1]. 

Ainsi, nous venons de démontrer que h! mh constitue bien un anneau puisqu'il possède une addition, 
une multiplication, un élément neutre et un inverse. 

□C.Q.F.D. 


3.4. FRACTIONS CONTINUES 


La notion de fraction continue remonte à l'époque de Fermât et atteint son apogée avec les travaux de 
Lagrange et Legendre vers la fin du 18ème siècle. Ces fractions sont importantes en physique car nous 
les retrouvons en acoustique ainsi que dans la démarche intellectuelle qui a amené Galois à créer sa 
théorie des groupes. 

Considérons dans un premier temps le nombre rationnel alb avec (a,b) - 1 avec b > 0 et a > b ■ Nous 
savons que tous les quotients q i et les restes ^ sont dans le cadre de la division euclidienne des entiers 
positifs. 

Rappelons l'algorithme d'Euclide vu plus haut (mais noté de manière un peu différente): 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


174/4839 







Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


a /î 

r* + i 


= #2 +' 


r\ , r 3 (4-85) 

n r 2 


5,-2 

5,-1 




Par substitutions successives, nous obtenons: 


a 1 1 

r , 1+ - =qt+ —- 


< 7;2 + 


r \ ir 2 


<?! +' 


?2+‘ 


? 3 +: 


(4.86) 


1 


1 

tfn-l +- 


Ce qui est aussi parfois noté: 


a 1 1 

1 = qx + T1~ = qi+ — 77 1 — 
^ K 4" 1/ ^2 


(4.87) 


Ainsi, tout nombre rationnel positif peut s'exprimer comme une fraction continue finie où q n e N . 

Exemples: 

El. Cherchons l'expression de 17/49. Nous savons déjà que 0 <17/49 <1 donc que q 1 = 0 . Nous 
avons alors: 


17 = o + _!_ = o + Ç =0+ _L— = o+— 1 


49 49/17 2 + _ 1 


17/15 


2 + ■ 


2 + ■ 


1 


1 + - 


15/2 


1 +- 


1 


7 + 


1 


2/1 


Nous voyons bien dans cet exemple que nous avons effectivement e N . Nous pouvons également 
remarquer que par construction: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


175/4839 


























Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 





(4.89) 


où les crochets représentent la partie entière et nous avons aussi: 

1 

-= <?„ + £■„ (4.90) 

Vl 

E2. Voyons comment extraire la racine carrée d'un nombre A par la méthode des fractions continues. 

Soit a le plus grand nombre entier dont le carré a 2 est plus petit que A. On le soustrait de A. Il y a donc 
un reste de: 

r = A-a 2 = {^[Â - aj{^JÂ + aj (4.91) 

où nous avons utilisé une des identités remarquables vues dans le chapitre d'Algèbre. D'où en divisant 
les deux membres par la deuxième parenthèse, nous avons: 


■JÂ ~ a = -==- - (4.92) 

y/A +a 


Soit: 


*JÂ = a+—=^ — (4.93) 

-JA +a 

Dans le dénominateur, nous remplaçons ^4 par: 


a + —jS — (4.94) 

y ^4 + ü 


Cela donne: 


— ÛE +- 

^ 4 .. r _ ^ 

+ £3! 

etc.... on voit ainsi que le système est simple pour déterminer l'expression d'une racine en termes de 
fraction continue. 

Le développement du nombre a/b s'appelle le "développement du nombre a/b en fraction continue 
finie" et est condensé sous la notation suivante: 

[sï>02>?3>->Ïh] (4-96) 

Nous considérerons comme intuitif que tout nombre rationnel peut s'exprimer comme fraction continue 
finie et inversement que toute fraction continue finie représente un nombre rationnel. Par extension, un 
nombre irrationnel est représenté par une fraction continue infi nie! 



[Vincent ISOZ] | http://www.sciences.ch] | Page: 


176/4839 















Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

Considérons maintenant ,q 2 ,q 3 ,...,q n ] une fraction continue finie. La fraction continue: 


c k =[M2 "•>?*] ( 4 - 


où k -1 ,est appelée la "/c-ième réduite" ou la "/c-ième convergente" ou encore le "A-ième 
quotient partiel". 

Avec cette notation, nous avons: 


Ci - [<ïi] - <h 

_ . 1 Ai q 2 +1 

C 2 =[<?i,Î2] = l ?l +-= —- 

02 02 


C3 — [<?i 7 !?2 ' ] — #1 "*■ 


1 


+<?i 


1 

Ï 2 + — 

$3 


= [^1 -‘ 3 r 2 -‘ S r 3-^ f 4 ] = 


<? 2?3 +1 

{(■?lg2 +1 ) ?3 +l ?l} g4 + (?l‘?2 + 1 ) 
(^2^3 +1 ) + ?2 


(4.98) 


Pour simplifier les expressions ci-dessus, nous introduisons les suites J ,{ 1 ^.} (n pour numérateur et d 
pour dénominateur) définies par: 


« 0 = 1 , *L=fli. 
d?o = 0, d-y — 1, 


n i =q i ïl i _ l +n i _ 2 

d i =q i d i _ l +d i _ 2 


(4.99) 


à l'aide de cette construction, nous avons une petite inégalité immédiate intéressante pour un peu plus 
loin: 


0 = £5 ? 0 <di <d 2 <d 3 .... (4.100) 


Avec la définition ci-dessus, nous constatons que: 


„ «1 „ «2 ~ n 3 ~ n A 

Q — — ,C 2 — —, C3 — —— 4 — —— (4.101) 


d 


d -, 


d* 


Soit en généralisant: 


Cjfc - \<î\,<Î2 ’ -’Qk ] - ~T~ (4.102) 

Maintenant, montrons pour un usage ultérieur que pour i >\, nous avons: 

n A-\ -<4Vl = (-!)’ C.I03) 

Le résultat est immédiat pour i = \. En supposant que le résultat est vrai pour i montrons qu'il est aussi 
vrai pour i +1. Puisque: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


177/4839 










Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


i+l 


- d 2+l n i = +n i-l") d 2 - (%+l d i + d i-l)»i = - { d i-\»i - ^i-\ d i) = H) 


alors en utilisant l'hypothèse d'induction, nous obtenons le résultat! 

Nous pouvons maintenant établir une relation indispensable pour la suite. Montrons que si C k est la 
Â-ième réduite de la fraction continue simple finie [ q 1 ,q 2 ,...,q n ] alors: 

Cj ^ ^ ^ ^ Cg ^ C 4 ^ C 2 (4.105) 


Démonstration: 


k+2 C k 

~ C^ifc+2 




n k+2 

«JM 

+ 

K d k+2 

d k+\ 2 


K k+2 d k+l d k+2 


1fc-u 




d 


k J 


n k+2 d k+l n k+\ d k+2 


dl-Aj-ldir 


Kl 


d k+2 d k+\ 


\ { 

+ 


“k+\ d k ~ d k+\ n k 


Æ+2 U Æ+1 

\ 


d k+\ d k 


(- 1 ) 


/ 

k+2 


\+\ d k \ d k+\ 


d k+2 d k+l 


■ + 


(- 1 ) 


d k-A d k 

,î;+l 


d k+\ d k 


(-1 ) k +2 d k + (- i )*^ +2 _ (- 1 )* + 1 (- 1)<4 + (- i )*^ 


ifc+2 


d k+2 d k -O d k d k+2 d k+\ d k 

-{-\) k *d k +{-\f*d k+2 C-l) fc+1 (^ + 2 -dk) 


d k+2 d k+\ d k 


d k+2 d k+l d k 


(4.106) 


puisque: 


0 — ü?q ^ d j d 2 ^ d 3 .... (4.107) 


donc: 


dk+2~d k >0 (4-108) 

ce qui nous indique que le signe -k+2 - Qk est le même que celui de (-1)* +1 . 

Il en résulte que C k+2 > C k pour k impair, et que C k+2 < C k pour k pair. Il s'ensuit que: 

Q <C 3 <C 5 <... et C 2 > C 4 > C 6 >... (4.109) 


Ensuite, puisque: 

c _ c _ «*-1 _ * k d k -i ~d k n k ^ _ (- 1 )* 

d k d k-l d k d k-\ d k d k-l 

Donc pour k pair, nous avons C k > C k _ Y , nous en déduisons donc: 

C\ <C 3 <C 5 <...<C 6 <C 4 <C 2 (4.111) 


□C.Q.F.D. 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


178/4839 


































Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

Montrons maintenant que toute fraction continue infinie peut représenter un nombre irrationnel 
quelconque. 

En des termes formels, si {q n ) est une suite d'entiers tous positifs et que nous considérons 
C n = [#i ,q 2 ,] alors celui-ci converge nécessairement vers un nombre réel si ?i —> + 00 . 

Effectivement il n'est pas difficile d'observer (c'est assez intuitif) avec un exemple pratique que nous 
avons: 


C k - —» 0 (4.112) 


lorsque k —ï + 00 . 

Maintenant, notons x un nombre réel quelconque et q l = [x] la partie entière de ce nombre réel. Alors 
nous avons vu tout au début de notre étude des fractions continues que: 

x = q 1 +e 1 (4.113) 


Il vient donc que: 


S l =x-q 1 (4.114) 


Attardons-nous pour les nécessités du chapitre d'Acoustique sur le calcul d'une fraction continue d'un 
logarithme en utilisant la relation précédente! 

D'abord rappelons que: 


a 1 1 

t^i+t—= ?i +— 77T~ 
b 1/ £i <? 2 + 1/ ^2 


(4.115) 


Soit (relation démontrée dans le chapitre d'Analyse Fonctionnelle): 


, , , ln(u) 

x=log a (u)=—— (4.116) 

ln(ûf) 


avec 1 <a<u et (a,u) = 1. 
Soit y n défini par: 


Alors montrons que: 


y -1 =a 


yo = a y** = 



(4.117) 


folX-2 ) 

ln Cy„-i) 


(4.118) 


En effet, pour « = l nous avons: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


179/4839 











Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


= x - q 1 


ln(u) 

Info 


■ïi 


InÇv-l) 

Info ) 


(4.119) 


pour n = 2 nous avons d'abord: 


Info Info - Info Info-ln(ifo) 

Info Info Info 


\ 


« ) 

ln 

y-\ 

K.cfi J 


0^ 

1—■ 


Info Info 


h fa) <4J20) 

Info 


donc: 


1 Info 


e l Info) 


(4.121) 


et puisque nous avions montré que: 

1 1 Info Info) 

-=«?„+£■„=> ^2 = —'72 = T ~ ( —7 _ “72 = 77—T “ ?2 ( 4 - 122 ) 

Ç.-1 e l Info) Info) 

etc... par récurrence ce qui démontre notre droit d'utiliser ce changement d'écriture. 

Exemple: 

Cherchons l'expression de la fraction continue de: 

X = log fl fo = log 2 (3) (4.123) 

Nous savons en jouant avec la définition du logarithme que: 

2 1 <3 < 2 2 (4-124) 


donc: 


lo S2 (2 1 ) < log 2 (3) < 1 og 2 {2 2 ) => log 2 ( 2) < log 2 (3) < 2 ■ log 2 ( 2) 
=>1 <2=> i < log 2 (3) <2 

log a (2) 

donc q 1 = 1. Nous avons alors: 


(4.125) 


et puisque: 


il vient: 


lnfo_ 2 ) _ lnpfo 
Infofo qi Info) 


(4.126) 


y~\=u= 3 y 0 =a = 2 (4.127) 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


180/4839 



























Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


ln(3) . 

(4-128) 

ln(2) 


Donc nous avons le premier quotient partiel: 


a , 1 . 1 

T = l°g 2 ( 3 ) = 01 + 7777 = 1 + , — -7 


1/£i 


1/ 


ln(3) 

ln(2) 


-1 


(4.129) 


V V V / 


Et in extenso nous avons déjà: 


_ 7-i _ 3 _ 3 

^o-u - y\ ~ —q^ ~ Tf - 2 (4-130) 

J'o * 


Simplifions: 


/l /TV \ 


1/ 


ln(3) , ln(2) ln(2) 


ln(2) 


■-1 




ln 


Info) (4-131) 


Donc le premier quotient partiel peut s'écrire: 


log 2 (3)=l + . 


1 


lu (2) 


ln bi) 


et passons au deuxième quotient partiel. Nous savons déjà pour cela que: 


lÆ <2 

,„2 

UJ 


(4.133) 


donc il est immédiat que q 2 = 1 et alors comme: 


(4 .,34) 




nous avons: 


ln(2) - ln - 

Info)) ln(2) , l2, 

s 2 = \ ; r - 02= -— - 1 = 


ln 


(-) 


Info) 


ln li 


Kl 




(4.135) 


ln 


\£J 


Il vient finalement: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


181/4839 

































Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


log 2 (3) = q 1 


1 

+ - 

#2 + 1^2 




(4.136) 


etc... etc. 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


182/4839 













Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 



[Vincent ISOZ] | http://www.sciences.ch] | Page: 


183/4839 






















































































Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


184/4839 






















































































Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


185/4839 






















































































Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


186/4839 























































































[SCIENCES.CH] 



L 


ors de notre étude des nombres, des opérateurs, et de la théorie des nombres (dans les chapitres du 


même nom), nous avons assez souvent utilisé les termes "groupes", "anneaux", "corps", 
"homomorphisme", etc. et continuerons par la suite à le faire encore de nombreuses fois. Outre le fait 
que ces concepts soient d'une extrême importance, permettant de faire des démonstrations ou de 
construire des concepts mathématiques indispensables à l'étude de la physique théorique contemporaine 
(physique quantique des champs, théories des cordes, modèle standard,...), ils permettent de 
comprendre les composants et les propriétés de base de la mathématique et de ses opérateurs en 
rangeant ceux-ci par catégories distinctes. Ainsi, choisir de mettre la théorie des ensembles en tant que 
cinquième chapitre de ce site est un choix tout à fait discutable puisque rigoureusement c'est par là que 
tout commence... Cependant, nous avions besoin d'exposer quand même la théorie de la démonstration 
ne serait-ce que pour les notations et les méthodes dont il sera fait usage ici. 

Par ailleurs, lors de l'enseignement des mathématiques modernes dans le secondaire, voire primaire 
(années 1970), on introduisit le langage des ensembles et l'étude préalable des relations binaires pour 
une approche plus rigoureuse de la notion de fonctions et d'applications (voir la définition plus loin) et 
de la mathématique en général. 

Définition: Nous parlons de "diagramme sagittal" (ou de "schéma sagittal" du latin sagitta = flèche) 
pour tout schéma représentant une correspondance entre les composantes de deux ensembles reliés 
totalement ou partiellement par un ensemble de flèches. 


Exemple: 


La représentation graphique d'une fonction définie de l'ensemble £= {-3,-2,-1,0,1,2,3} vers l'ensemble 
F={0,1,2,3,...9} conduirait au diagramme sagittal ci-dessous: 



Figure: 5.1 - Fonction d’un ensemble de définition à un autre ensemble d’arrivée 


Une relation de E dans E fournirait un diagramme sagittal du type: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 



















[SCIENCES.CH] 



Figure: 5.2 - Fonction renvoyant dans son propre ensemble de définition 


Le bouclage de chaque élément montrant une "relation réflexive" et la présence systématique d'une 


flèche retour indiquant une "relation symétrique". 

Définition: Si l'ensemble d'arrivée est identique à l'ensemble de départ, nous disons que nous avons une 
"relation binaire". 

Cependant le choix d'introduire la théorie des ensembles dans les classes d'école a une raison aussi un 
peu autre. Au fait, dans un souci de rigueur interne (in extenso: non liée à la réalité), une très grande 
partie des mathématiques a été reconstruite à l'intérieur d'un seul cadre axiomatique, dénommé donc 
"théorie des ensembles", dans le sens où chaque concept mathématique (autrefois indépendant des 
autres) est ramené à une définition dont tous les constituants logiques proviennent de ce même cadre: 
elle est considérée comme fondamentale. Ainsi, la rigueur d'un raisonnement effectué au sein de la 
théorie des ensembles est garantie par le fait que le cadre est "non-contradictoire" ou "consistant". 
Voyons les définitions qui construisent ce cadre. 

Définitions: 

Dl. Nous appelons "ensemble" toute liste, collection ou rassemblement d'objets bien définis, 
explicitement ou implicitement. 

D2. Un "Univers" U est un objet dont les constituants sont des ensembles. 

Il faut noter que ce que les mathématiciens appellent "univers" n'est pas un ensemble! En fait il s'agit 
d'un modèle qui satisfait aux axiomes des ensembles. 

Effectivement, nous verrons que nous ne pouvons pas parler de l'ensemble de tous les ensembles (ce 
n'est pas un ensemble), pour désigner l'objet qui est constitué de tous les ensembles ainsi, nous parlons 
d'univers. 

D3. Nous appelons "éléments" ou "membres de l'ensemble" les objets appartenant à l'ensemble et nous 
notons: 


peA (5.1) 


si p est un élément de l'ensemble A et dans le cas contraire: 


Pt A (5.2) 


Si B est une "partie" de A, ou sous-ensemble de A, nous notons cela: 


B c A ou A d B (5.3) 


dès lors, si pour tout: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 







Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

Vx,xe B=> xe A (5.4) 

Nous identifions également un ensemble soit en listant ses éléments (pas toujours forcément 
dénombrables par ailleurs!), soit en donnant la définition de ses éléments (nombres pairs, impairs, 
diviseurs entiers de..., etc.). 

Exemples: 


El. A = (1, 2, 3} 


E2. X = (x | x est un entier positif) 

D3. Nous pouvons munir les ensembles d'un certain nombre de relations qui permettent de comparer 
leurs éléments (c'est utile parfois...) ou de comparer certaines de leurs propriétés. Ces relations sont 
appelées "relations de comparaisons" ou "relations d'ordre" (cf. chapitre sur les Opérateurs). 


Remarques : 

RI. La structure d'ensemble ordonnée a été mise en place à la base dans le cadre de la théorie des 
Nombres par Cantor et Dedekind. 

R2. Comme nous l'avons démontré dans le chapitre sur les Opérateurs, N,Z,Q,IR sont totalement 
ordonnés par les relations usuelles <, > . La relation < , souvent dite "d'ordre strict", n'est pas une 
relation d'ordre car non réflexive et non antisymétrique (cf. chapitre sur les Opérateurs). Par 
exemple, dans N , la relation "a divise b ", souvent notée par le symbole " | ", est un ordre partiel. 

R3. Si R est un ordre sur E et F est une partie de E, la restriction à F de la relation R est un ordre 
sur F, dit "ordre induit par R dans F". 

R4. Si R est un ordre sur E, la relation R' définie par: 

xfi 'y <=> yRx (5.5) 

est un ordre sur E, dit "ordre réciproque" de R. L'ordre réciproque de l'ordre usuel < est l'ordre noté 
> ainsi que l'ordre réciproque de l'ordre "a divise b " dans N est l'ordre "b est multiple de a". 


L'ensemble est l'être mathématique de base, dont l'existence est posée: il n'est pas défini en tant que tel, 
mais par ses propriétés, données par les axiomes. Il fait appel à une procédure humaine: une sorte de 
fonction de catégorisation, qui permet à la pensée de distinguer plusieurs éléments qualifiés 
d'indépendants. 

Nous pouvons démontrer à partir de ces concepts, que le nombre de sous-ensembles d'un ensemble de 
cardinal n est 2* ■ 

Démonstration: 

Il y a d'abord l'ensemble vide 0, soit 0 élément choisi parmi n, in extenso Cl (notation du coefficient 
binomial non conforme à la norme ISO 31-11!) conformément à ce que nous avons vu dans le chapitre 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


189/4839 









Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

de Probabilités: 


Cï = 


y «'' 


\ k / 


4 

k\ 


k\ 


k ! (« - A:) ! 


(5.6) 


et ainsi de suite... 

Le nombre de sous-ensembles (cardinal) de E correspond donc à la sommation de tous les coefficients 
binomiaux: 


H 


card iP(Ei) =^Cl 
fc =0 


(5.7) 


Or, nous avons (cf. chapitre de Calcul Algébrique): 


(* + ?)" =£ C »*V r '‘ (58) 
£=0 


Donc: 


card ( P(E )) = 2 Ck = G + 1)" = 2" 

.t =<Il 


(5.9) 


nC.Q.F.D. 


Exemple: 

Considérons l'ensemble S = {xj.Xj, x 3 ), nous avons l'ensemble des parties P(S) constitué par: 

- "L'ensemble vide": {} = 0 

- Les "singletons": {x x } ,{x 2 ), (x 3 ) 

-Les duets . 

- Lui-même : {Xj, x 2 , x 3 } 

Tel que: 

P(£T) = {0.{Xi},{X2},{* 3 },{Xi,X2),(Xi,X 3 },{X2,X3},{Xi,X2 > Jg}} (5.10) 

Ce qui fait bien 8 éléments! 

Remarque : L'ordre dans lequel sont différenciés les éléments ne rentre pas en compte lors du 
comptage des parties de l'ensemble de départ. 

En mathématique appliquée, nous travaillerons presque exclusivement avec des ensembles de nombres. 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


190/4839 















Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

Nous nous restreindrons donc à l'étude des définitions et propriétés de ces derniers. 

Maintenant, formalisons les concepts de base permettant de travailler avec les ensembles les plus 
courants que nous rencontrons dans les cursus scolaires de base. 

1. AXIOMATIOUE DE ZERMELO-FRAENKEL 

L'axiomatique de Zermelo-Fraenkel, abrégée "axiomatique ZF-C", présentée ci-dessous a été formulée 
par Ernst Zermelo puis précisée par Adolf Abraham Fraenkel au début du 20ème siècle et complétée 
par l'axiome du choix (d'où le C majuscule dans ZF-C). Elle est considérée comme la plus naturelle 
dans le cadre de la théorie des ensembles. 


Remarque : Il existe bien d'autres axiomatiques, basées sur le concept plus général de "classe", 
comme celle développée par von Neumann, Bemays et Gôdel (pour les notations, voir le chapitre 
traitant de la Théorie De La Démonstration). 


Strictement et techniquement parlant, les axiomes de ZF sont des énoncés du calcul des prédicats du 
premier ordre (cf. chapitre de Théorie De La Démonstration) égalitaire dans un langage ayant un seul 
symbole primitif pour l'appartenance (relation binaire). Ce qui suit doit donc seulement être perçu 
comme une tentative d'exprimer en français la signification attendue de ces axiomes. 

Al. Axiome d'extensionnalité: 

Deux ensembles sont égaux si, et seulement si ils ont les mêmes éléments. C'est ce que nous notons: 

A = B O (Vxe A,x e B) f\(Vxe. B, j4) (5.il) 

Donc A et B sont égaux si tout élément x de A appartient aussi à B et tout élément x de B appartient 
aussi à A. 

A2. Axiome de l'ensemble vide: 

L'ensemble vide existe, nous le notons: 


0 (5.12) 

et il n'a aucun élément, son cardinal vaut donc 0. 

En réalité cet axiome peut être déduit à partir d'un autre axiome que nous verrons un peu plus loin mais 
il est pratique à introduire en tant que tel par commodité pédagogique dans les petites classes. 

A3. Axiome de la paire: 

Si A et B sont deux ensembles, alors, il existe un ensemble C contenant A et B et eux seuls comme 
éléments. Cet ensemble C se note alors {A, B}. 

Du point de vue des ensembles considérés comme des éléments cela donne: 

VAV53C (deCA5eC) (5.13) 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


191/4839 











Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

Cet axiome montre aussi l'existence du "singleton" (single=seul) d'un ensemble noté: 

{X) (5.14) 

qui est un ensemble dont le seul élément est X (donc de cardinal unitaire). Il suffit pour cela d'appliquer 
l'axiome en posant l'égalité entre A et B. 

A4. Axiome de la somme (dit aussi "axiome de l'union" ou encore "axiome de la réunion"): 

Cet axiome permet de construire la réunion d'un ensemble; dit de façon plus commune: la réunion d'une 
famille quelconque d'un ensemble, est un ensemble. 

Autrement dit, il existe pour tout ensemble quelconque, un ensemble qui contient exactement les 
éléments de tout élément de l'ensemble. La formalisation (peu intuitive) de cet axiome est la suivante: 

VA35VC (CeB^3D(DeAACeD)) ( 5 . 15 ) 


C'est-à-dire qu'étant donné un ensemble quelconque A, il existe un ensemble B tel que, pour tout 
ensemble C quelconque, C est élément de B si et seulement s'il existe un ensemble D tel que D soit un 
élément A et que C soit un élément de D. 

Un petit exemple particulier ne fera peut-être pas de mal...: 


^={*l-*2> 

* = LM = 


* 3 } 

f C c c ] 

I—Il—Il—I 

) jAljCjA^.’Wr 


D D D 


(5.16) 


Nous voyons que conformément à l'axiome, chaque D est un élément de A et que chaque C est un 
élément de D et ce pour chaque C appartenant à B. De même si nous prenons: 


A = {x l7 x 2 , 

* = LM= 


f C C "I 

I—I I—I 

u*i.*2Î.{*3)r 

i_11_i 


D fl J 


(5.17) 


L'ensemble B est donc noté: 

U A (5.18) 


ou: 


U x (5.19) 

xe A 


A5. Axiome des parties (dit aussi "axiome de l'ensemble des parties"): 

Il exprime que pour tout ensemble A, l'ensemble de ses parties P (A) existe. 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


192/4839 














Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

Donc à tout ensemble A, nous pouvons associer un ensemble B qui contient exactement les parties (in 
extenso les sous-ensembles) C du premier: 

Vj 435VC (Ce^^Cci) ( 5 . 20 ) 

Nous avons vu un tel exemple déjà plus haut avec S = (xj, x 2 , : 

A6. Axiome de l’infini: 

Cet axiome exprime le fait qu'il existe un ensemble infini. 

Pour le formaliser, nous disons qu'il existe un ensemble, dit "ensemble autosuccesseur" K contenant 0 
(l'ensemble vide) tel que si x appartient à K, alors x u{x) appartient également à K: 

K est autosuccesseur: <=> (0 e K) f\(xe K => x u(x) e K) (5.22) 

Cet axiome exprime donc que l'ensemble des entiers existe. Effectivement, pj est ainsi le plus petit 
ensemble autosuccesseur, au sens de l'inclusion N = {0,...}}} et par convention nous notons 

(où nous construisons l'ensemble des naturels): 


0 = 0 


1 ={ 0 } 

2 = { 0 ,( 0 }} 


(5.23) 


A7. Axiome de régularité (dit aussi "axiome de fondation"): 

Le but principal de cet axiome est d'éliminer la possibilité d'avoir A comme élément de lui-même. 

Ainsi, pour tout ensemble non vide A, il existe un ensemble B qui est élément de A tel qu'aucun élément 
de A ne soit élément de B (il faut bien différencier le niveau du langage utilisé, un ensemble et ses 
éléments n'ont pas le même statut) ce que nous notons: 

A * 0 => 3Be A, An B = 0 (5.24) 


En conséquence: 


V4 A<£ A (5.25) 


Démonstration: 

En effet, soit A un ensemble tel que A e A - Considérons le singleton{A}, ensemble dont le seul élément 
est A. D'après l'axiome de fondation, nous devons avoir un élément de ce singleton qui n'a aucun 
élément en commun avec lui. Mais le seul élément possible est A lui-même, c'est-à-dire que nous 
devons avoir: 


An(A)=0 (5.26) 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


193/4839 






Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

Or par hypothèse, A e A et par construction 21 e {A \. Donc A e An {A }, ce qui contredit l'assertion 
précédente. Donc: 


A£ A (5.27) 


□C.Q.F.D. 


A8. Axiome de remplacement (dit aussi "schéma de remplacement"): 

Cet axiome exprime le fait que si une formule/est une fonctionnelle alors pour tout ensemble A, il 
existe un ensemble B constitué exactement des images des éléments A par cette fonction. 

Soient, de manière un peu plus formelle, l'ensemble A d'éléments a et la relation binaire/(qui est donc 
en toute généralité une fonctionnelle), il existe un ensemble B constitué des éléments b tel que f(a,b) 
soit vraie. Si/est une fonction où b est non libre cela signifie alors que: 

b = J{a) et B = f{A) (5.28) 

De manière technique nous écrivons cet axiome sous la forme: 

WIVüs e A 3\bf{a,b)^3BVaeA 3beBf{a,b) (5.29) 

Donc pour tout ensemble A et tout élément qu'il contient, il existe un et un seul b défini par la 
fonctionnelle / tel qu'il existe un ensemble B où pour tout élément a appartenant à l'ensemble A il existe 
un b appartenant à l'ensemble B défini par la fonctionnelle /. 

Voyons un exemple avec le prédicat binaire suivant qui pour la valeur de tout a de A détermine la 
valeur de tout b de B: 


P{a,b) = (a = 1A b = 2) v(a = 3 f\b = 4) (5.30) 

Donc de la connaissance que a vaut 1 nous en dérivons que b vaut 2 et de manière similaire (in extenso 
par remplacement) si a vaut 3, nous en dérivons que b vaut 4. 

Nous voyons bien au travers de ce petit exemple la relation forte qu'il y a à considérer le prédicat P 
comme une fonction naïve! Par ailleurs, comme il y une infinité possible de fonctions/, le schéma de 
remplacement est considéré comme une infinité d'axiomes. 

A9. Axiome de sélection (dit aussi "schéma de compréhension"): 

Cet axiome exprime simplement que pour tout ensemble A et toute propriété P exprimable dans le 
langage de la théorie des ensembles, l'ensemble des éléments de A qui satisfont la propriété P existe. 

Donc de manière plus formelle, à tout ensemble A et toute condition ou proposition P(x), il correspond 
un ensemble B dont les éléments sont exactement les éléments x de A pour lesquels P(x) est vraie. C'est 
ce que nous notons: 


5 = {xed:P(i)} (5.31) 

De manière plus complète et rigoureuse nous avons en réalité pour toute fonctionnelle/ ne comportant 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


194/4839 






Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

pas a comme variable libre: 


\M35Va (aeBç=>aeA/\f) (5.32) 

C'est typiquement l'axiome qui nous sert à construire l'ensemble des nombres pairs: 

{a e N | 3b e N.a = 7b) (5.33) 

ou à démontrer l'existence de l'ensemble vide (et qui rend caduc l'axiome de l'ensemble vide) car il 
suffit de poser qu'il existe un ensemble satisfaisant la propriété: 

A (5.34) 

et ce quel que soit l'ensemble A. Et seulement l'ensemble vide satisfait cette propriété de par l'axiome 
de sélection. 

Le respect des conditions très strictes de cet axiome permet d'éliminer les paradoxes de la "théorie 
naïve des ensembles", comme le paradoxe de Russel ou le paradoxe de Cantor qui ont invalidé la 
théorie naïve des ensembles. 

Considérons par exemple l'ensemble R de Russell de tous les ensembles qui ne s'auto-contiennent pas 
(notez bien que nous donnons une propriété de R sans expliciter quel est cet ensemble): 

R = {E:E£E] (5.35) 

Le problème est de savoir si R se contient ou non. Si Re R, alors, R s'auto-contient, et, par définition 
R £ R et inversement. Chaque possibilité est donc contradictoire. 

Si maintenant nous désignons par C l'ensemble de tous les ensembles (l'Universel de Cantor), nous 
avons en particulier: 


P(C)eC (5.36) 

ce qui est impossible (i.e. par exemple avec la puissance du continu de l'ensemble de réels), d'après le 
théorème de Cantor. 

Ces "paradoxes" (ou "antinomies syntaxiques") proviennent d'un non-respect des conditions 
d'application de l'axiome de sélection: pour définir E (dans l'exemple de Russel), il doit exister une 
proposition P qui porte sur l'ensemble R, qui doit être explicitée. La proposition définissant l'ensemble 
de Russell ou celui de Cantor n'indique pas quel est l'ensemble E. Elle est donc invalide! 

Un exemple fort sympathique et fort connu (c'est la raison pour laquelle nous le présentons) permet de 
mieux comprendre (il s'agit du paradoxe de Russel dont nous avons déjà parlé plus longuement dans le 
chapitre de Théorie De La Démonstration): 

Un jeune étudiant se rendit un jour chez son barbier. Il engagea la conversation et lui demanda s'il avait 
de nombreux concurrents dans sa jolie cité. De manière apparemment innocente, le barbier lui répondit: 
"Je n'ai aucune concurrence. En effet, de tous les hommes de la cité, je ne rase évidemment pas ceux 
qui se rasent eux-mêmes, mais j'ai le bonheur de raser tous ceux qui ne se rasent pas eux-mêmes." 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


195/4839 






Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

En quoi donc, une telle affirmation si simple put-elle mettre en défaut la logique de notre jeune étudiant 
si malin ? 

La réponse est en effet innocente, jusqu'au moment où nous décidons de l'appliquer au cas du barbier: 
Se rase-t-il lui-même, oui ou non? 

Supposons qu'il se rase lui-même: il entre dans la catégorie de ceux qui se rasent eux-mêmes, dont le 
barbier a précisé qu'il ne les rasait évidemment pas. Donc il ne rase pas lui-même. 

Très bien! Supposons alors qu'il ne se rase pas lui-même: il entre alors dans la catégorie de ceux qui ne 
se rasent pas eux-mêmes, dont le barbier a précisé qu'il les rasait tous. Donc il se rase lui-même. 

Finalement, ce malheureux barbier est dans une position étrange: s'il se rase lui-même, il ne se rase pas, 
et s'il ne se rase pas lui-même, il se rase. Cette logique est autodestructrice, stupidement contradictoire, 
rationnellement irrationnelle. 

Vient alors l'axiome de sélection: Nous excluons le barbier de l'ensemble des personnes auxquelles 
s'applique la déclaration. Car en réalité, le problème vient du fait que le barbier est un élément de 
l'ensemble de tous les hommes de la cité. Ainsi, ce qui s'applique à tous les hommes ne s'applique pas 
au cas individuel du barbier. 

A10. Axiome du choix: 

Étant donné un ensemble A d'ensembles non vides mutuellement disjoints, il existe un ensemble B 
(l'ensemble de choix pour A) contenant exactement un élément pour chaque membre de A. 

Indiquons cependant que la question de l'axiomatisation et donc des fondements se trouva quand même 
ébranlée de deux questions à l'époque de leur construction: quels axiomes valides doivent être choisis et 
dans un système d'axiomes la mathématique est-elle cohérente (ne risque-t-on pas de voir apparaître 
une contradiction)? 

La première question fut soulevée d'abord par l'hypothèse du continu: si nous pouvons mettre deux 
ensembles de nombres en correspondance terme à terme, ils ont le même nombre d'éléments (cardinal). 
Nous pouvons mettre en correspondance les entiers avec les rationnels comme nous l'avons démontré 
dans le chapitre sur les Nombres, ils ont donc même cardinal, nous ne pouvons par contre mettre en 
correspondance les entiers avec les réels. La question est alors de savoir s'il y a un ensemble dont le 
nombre d'éléments serait situé entre les deux ou pas? Cette question est importante pour construire la 
théorie classique de l'analyse et les mathématiciens choisissent en général de dire qu'il n'y en a pas, mais 
nous pouvons aussi dire le contraire. 

En fait l'hypothèse du continu est liée de manière plus profonde à l'axiome du choix qui peut aussi être 
formulé de la manière suivante: si C est une collection d'ensembles non vides alors nous pouvons 
choisir un élément de chaque ensemble de la collection. Si C a un nombre fini d'éléments ou un nombre 
dénombrable d'éléments, l'axiome semble assez évident: nous pouvons ranger les ensembles de C en les 
numérotant, et le choix d'un élément dans chaque ensemble est simple. Là où ça se complique c'est 
lorsque l'ensemble C a la puissance du continu: comment choisir des éléments s'il n'y pas la possibilité 
de les numéroter? 

Finalement en 1938 Kurt Gôdel montre que la théorie des ensembles est cohérente sans l'axiome du 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


196/4839 






Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

choix et sans l'hypothèse du continu aussi bien qu'avec! Et pour clore tout ça Paul Cohen montre en 
1963 que l'axiome du choix et l'hypothèse du continu ne sont pas liés. 

1.1. CARDINAUX 


Définition: Des ensembles sont dits "équipotents" s'il existe une bijection (correspondance biunivoque) 
entre ces ensembles. Nous disons qu'ils ont alors même "cardinal" que la norme ISO 3111 préconise 
d'écrire card mais sur le présent site internet nous utiliserons tantôt card que Card. 

Ainsi, plus rigoureusement, un cardinal (qui quantifie le nombre d'éléments contenus dans l'ensemble) 
est une classe d'équivalence (cf. chapitre sur les Opérateurs) pour la relation d'équipotence. 


Remarque : Cantor est le principal créateur de la théorie des ensembles, sous une forme que nous 
qualifions aujourd'hui de "théorie naïve des ensembles". Mais, à côté de considérations 
élémentaires, sa théorie comportait des niveaux d'abstraction élevés. La vraie nouveauté de la 
théorie de Cantor, c'est qu'elle permet de parler de l'infini. Par exemple, une idée importante de 
Cantor a justement été de définir l'équipotence. 


Si nous écrivons q = c 2 en tant qu'égalité de cardinaux, nous entendons alors par là qu'il existe deux 
ensembles équipotents A et B tels que: 

q = Card (j 4) et c 2 = Card (5) (5.37) 

Les cardinaux peuvent donc être comparés. L'ordre ainsi défini est une relation d'ordre total (cf. 
chapitre sur les Opérateurs) entre les cardinaux (la preuve que la relation d'ordre est totale utilise 
l'axiome du Choix et la preuve qu'elle soit antisymétrique est connue sous le nom de théorème de 
Cantor-Bemstein que nous démontrons d'ailleurs plus bas). 

Dire que q < c 2 signifie dans un vocabulaire simple que A est équipotent à une partie propre de B, mais 

B n'est équipotent à aucune partie propre de A. Les mathématiciens diraient que le Card(A ) est plus 
petit ou égal au Card(B) s'il existe une injection de A dans B. 

Nous avons vu lors de notre étude des nombres, en particulier des nombres transfinis, qu'un ensemble 
équipotent (ou en bijection) à N était dit "ensemble dénombrable". 

Voyons cette notion un petit peu plus dans les détails: 

Soit A un ensemble, s'il existe un entier n tel qu'il y ait au moins à chaque élément de A un 
correspondant dans l'ensemble {1,2,...«}(au fait rigoureusement il s'agit d'une bijection... concept que 
nous définirons plus tard) nous disons alors que le cardinal de A, noté Card(A ) ou card(A), est un 
"cardinal fini" et vaut n. 

Dans le cas contraire, nous disons que l'ensemble A est de "cardinal infini" et nous posons: 

Card (A) = +°o (5.38) 

Un ensemble A est donc "dénombrable" s'il existe une bijection entre A et N . Un ensemble de nombre 
A est "au plus dénombrable" s'il existe une bijection entre A et une partie N . Un ensemble au plus 
dénombrable est donc soit de cardinal fini, soit dénombrable. 

[Vincent ISOZ] | http://www.sciences.ch] | Page: 


197/4839 









Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

Nous vérifions dès lors les propositions suivantes: 

PL Une partie d'un ensemble dénombrable est au plus dénombrable. 

P2. Un ensemble contenant un ensemble non-dénombrable n'est lui aussi pas dénombrable. 

P3. Le produit de deux ensembles dénombrables est dénombrable. 

Remarque : Nous pouvons restreindre un ensemble de nombres par rapport à l'élément nul et aux 
éléments négatifs ou positifs qu'il contient et dès lors nous notons (exemple pour l'ensemble des 
réels): 

IR* = IR \ {0} 

IR + = {x | x E IR et x > 0} 

IR_ = {x | xe IR et x < 0} (5.39) 
m.* + =IR + \{0} 

El = IR_ \{0} 

Ces notions étant analogues pour N,Z,Q (l'ensemble des nombres complexe n'étant pas ordonné, 
la deuxième et troisième ligne ne s'y applique pas). 


Donc tout sous-ensemble infini de N est équipotent à N lui-même, ce qui peut sembler contre-intuitif 
au premier abord...! 

En particulier, il y a autant d'entiers naturels pairs que d'entiers naturels quelconques (utiliser la 
bijection / (n) = 2n ) de pJ vers P, où P désigne l'ensemble des entiers naturels pairs), autant d'entiers 
relatifs que d'entiers naturels, autant d'entiers relatifs que de nombres rationnels (voir le chapitre 
traitant des nombres pour les démonstrations). 

Nous pouvons donc écrire: 


Cara?( N) = Card(Z) = Card (<Qj) = K 0 


(5.40) 


et plus généralement, toute partie infinie de Q est dénombrable. 

Un résultat important: tout ensemble infini possède donc une partie infinie dénombrable. 

Puisque nous avons démontré dans le chapitre traitant des nombres que l'ensemble des réels avait la 
"puissance du continu" et que l'ensemble des nombres naturels était de cardinal transfini , Cantor 

souleva la question s'il existait un cardinal transfini entre K 0 et le cardinal de IR ? Autrement dit, nous 

avons donc une quantité infinie de nombres entiers, et une quantité encore plus grande de nombres 
réels. Alors, existe-t-il un infini qui soit à la fois plus grand que celui des entiers et plus petit que celui 
des nombres réels? 

Le problème se posa en notant bien évidemment le cardinal de pj et (nouveauté) le cardinal de 
IR et en proposant de démontrer ou de contredire que: 

[Vincent ISOZ] | http://www.sciences.ch] | Page: 


198/4839 









Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

= 2“° (5.41) 

selon la loi combinatoire qui donne le nombre d'éléments de l'ensemble que l'on peut obtenir à partir de 
tous les sous-ensembles d'un ensemble (tel que nous l'avons démontré précédemment). 

Le reste de sa vie, Cantor essaya, en vain, de démontrer ce résultat que l'on nomma "l'hypothèse du 
continu". Il n'y réussit pas et sombra dans la folie. En 1900, au congrès international des 
mathématiciens, Hilbert estima qu'il s'agissait là d'un des 23 problèmes majeurs qui devraient être 
résolus au 20ème siècle. 

Ce problème se résout d'une façon assez étonnante. D'abord, en 1938, un des plus grands logiciens du 
20ème siècle, Kurt Gôdel, démontra que l'hypothèse de Cantor n'était pas réfutable, c'est-à-dire qu'on 
ne pourrait jamais démontrer qu'elle était fausse. Puis en 1963, le mathématicien Paul Cohen boucla la 
boucle. Il démontra qu'on ne pourrait jamais non plus démontrer qu'elle était vraie!!! Nous pouvons 
conclure à juste raison que Cantor avait perdu la raison à chercher à démontrer un problème qui ne 
pouvait pas l'être. 

1.2. PRODUIT CARTÉSIEN 


Si E et F sont deux ensembles, nous appelons "produit cartésien de E par F" l'ensemble noté ExF (à 
ne pas confondre avec le produit vectoriel) formé de tous les couples possibles ( e,f ) où e est un 
élément de E et/un élément de F. 

Autrement écrit: 


ExF = {(e,f)\eeE/\feF} 


(5.42) 


Nous remarquons facilement que E x F et F x E ne sont pas les mêmes ensembles (sauf bien sur si 
E = F). 


Nous notons le produit cartésien de E par lui-même: 


E x E = E 2 


(5.43) 


et nous disons alors e 2 es t "l'ensemble des couples d'éléments de E". 


Nous pouvons effectuer le produit cartésien d'une suite d'ensembles E 1 x F 2 x... x E x et ainsi obtenir 
l'ensemble des n-uplets (^,e 2 ,...,e K ) o ix e 1 E E 1 ,e 2 e E 2 ,...,e s e E s . 


Dans le cas où tous les ensembles F s sont identiques à E, le produit cartésien E 1 x F 2 x... x E x se note 
bien évidemment e* ■ Nous disons alors que e x est "l'ensemble des o-uplets d'éléments de E". 

Si E et F sont finis alors le produit cartésien F x F est fini. De plus: 

CardiE x F) = Card(E) ■ Card(F) (5.44) 


De là, nous voyons que si les ensembles E 1 ,E 2 ,...,E X sont finis alors le produit cartésien 
F) x E 2 x ... x E x est aussi fini et nous avons: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


199/4839 









Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

H 

Card(E Y x E 2 x...x E„) = J - [ Ca/"û?(Æ’ i ) (5.45) 

i-1 

En particulier, Card(E*) = [Card{E)f si E est un ensemble fini. 

Exemples: 

El. Si IR est l'ensemble des nombres réels, ir 2 est alors l'ensemble des couples de réels. Dans le plan 
rapporté à un repère, tout point M admet des coordonnées qui sont un élément de jr 2 . 

E2. Lorsque nous lançons deux dés dont les faces sont numérotées de 1 à 6, chaque dé peut être 
symbolisé par l'ensemble E = {1,2,3,4,5,6}. Le résultat d'un lancer est alors un élément de E^E ■ Le 
cardinal de est alors 36. Il y a donc 36 résultats possibles quand nous lançons 2 dés dont les 

faces sont numérotées de 1 à 6. 


Remarque :La théorie de base des ensembles ainsi que le concept de cardinal sont à la base 
théorique des logiciels de bases de données relationnelles. 


1.3. BORNES 

Soit M un ensemble de nombres quelconques de façon à ce que M c IR (exemple particulier mais 
fréquent) nous avons comme définitions: 

Dl. x e IR est appelé "borne supérieure" ou "majorant" de l'ensemble M, si x >m pour Vm e M ■ 
Inversement, nous parlons de "borne inférieure" ou de "minorant" (il ne faut donc pas confondre le 
concept de borne avec le concept d'intervalle!). 

D2. Soit M c IR,M ^ 0 . x e IR est appelé "plus petite borne supérieure" noté: 

x=supM (5.46) 

de M si x est une borne supérieure de M et si pour toute borne supérieure y e IR nous avons x < y 
Inversement, nous parlons de "plus petite borne inférieure" que nous notons: 

x = inf M (5.47) 

Les définitions sont équivalentes dans le cadre de l'analyse fonctionnelle (voir chapitre du même nom) 
puisque les fonctions sont définies sur des ensembles. 

Effectivement, soit/ une fonction dont le domaine de définition I balaie tout IR . Ce que nous notons 
/ : E — > IR et soit x 0 e IR. 

Dl. Nous disons que/présente un "maximum global" en x 0 si: 

Vx e E, /(x) < /(x 0 ) (5.48) 

D2. Nous disons que/présente un "minimum global" en x 0 si: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


200/4839 











Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

Vxe£,/(x)>/(x 0 ) (5.49) 

Dans chacun de ces deux cas, nous disons que/présente un "extremum global" en x 0 (c'est un concept 
que nous retrouverons souvent en mécanique analytique!). 

D3./est "majorée" s'il existe un réel Mtel que Vx e /,/(x) < M . Dans ce cas, la fonction possède une 
borne supérieure de/sur son domaine de définition / notée traditionnellement: 

(5.50) 

et elle représente donc la plus petite borne supérieure (le plus petit majorant). 

D4./est "minorée" s'il existe un réel Mtel que Vx e I,f (xj > M . Dans ce cas, la fonction possède une 
borne inférieure de/ sur son domaine de définition I notée traditionnellement: 

inf / (5.51) 

et elle représente la plus grande borne inférieure (le plus grand minorant). 

D5. Nous disons que/ est "bornée" si elle est à la fois majorée et minorée (c'est le cas des fonctions 
trigonométriques). 

2. OPÉRATIONS ENSEMBLISTES 

Nous pouvons construire à partir d'au moins trois ensembles A,B,C, l'ensemble des opérations (dont 
nous devons les notations à Dedekind) existant dans la théorie des ensembles (très utiles dans l'étude 
des probabilités et statistiques). 

Remarque : Certaines des notations présentes ci-dessous se retrouveront fréquemment dans des 
théorèmes complexes, il est donc nécessaire de bien comprendre de quoi il en retourne. 


Ainsi, nous pouvons construire les opérations ensemblistes suivantes: 

2.1, INCLUSIONS 

Dans le cas le plus simple, nous définissons "l'inclusion" par: 

A c B Vx[x e A => x e B\ 

En langage non spécialisé voici ce qu'il faut lire: A est "inclus" (ou "fait partie", ou encore est un "sous- 
ensemble") dans B alors pour tout x appartenant à A chacun de ces x appartient aussi à B: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


201/4839 












Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

ÀczB 


U 

Figure: 5.3 - Exemple visuel de l'inclusion 

où le U dans le coin inférieur droit de la figure représente l'univers (de Cantor). 

De ceci il en découle les propriétés suivantes: 

PI. Si A<~ B et B A alors cela implique A = B et réciproquement. 

P2. Si A c B et B <zC alors cela implique A c C ■ 

2.2. INTERSECTION 

Dans le cas le plus simple, nous avons: 

A n B = {x|x e A et x e B] 

En langage non spécialisé voici ce qu'il faut lire: "L'intersection" des ensembles A et B consiste en 
l'ensemble des éléments qui se trouvent à la fois dans A et dans B: 


Ar\B 



Figure: 5.4 - Exemple visuel de l'intersection 


Plus généralement, si ( 4 ) est une famille d'ensembles indexés par je/, l'intersection des ( 4 ),i e l 
est notée: 

ru ( 5 - 54 > 

Cette intersection est donc définie explicitement par: 



[Vincent ISOZ] | http://www.sciences.ch] | Page: 


202/4839 










Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


= { t:/ e / e } (5.55) 

ici 

C'est-à-dire que l'intersection de la famille d'ensembles indexés comprend tous les x qui se trouvent 
dans chaque ensemble de tous les ensembles de la famille. 

Soient deux ensembles A et B, nous disons qu'ils sont "disjoints" si et seulement si: 

AnB = 0 (5.56) 


Par ailleurs, si: 

En E=0^ Card {Ekj F) = Card ( E) + Card ( F) (5.57) 


Les mathématiciens notent cela: 


EUE (5.58) 


et l'appellent "union disjointe". 

On plaisante parfois en disant que la connaissance se construit sur la disjonction... (ceux qui 
comprendront apprécieront...). 

Définition: Une collection E = d'ensembles non vides forment une "partition" d'un ensemble A si 
les propriétés suivantes sont vérifiées: 

PL VE } , E } e E et i * j=$ E } nSj=0 

T2. A = IM 

S,eS 

Exemples: 

El. L'ensemble des nombres pairs et l'ensemble des nombres impairs forment une partition 

E2. La loi d'intersection n est une loi commutative (voir plus loin la définition du concept 
telle que: 


de Z • 
de "loi") 


2.3. RÉUNION/UNION 


AnB = BnA (5.59) 


Dans le cas le plus simple, nous avons: 

A^jB = (x|xe j4ou xe B } 

En langage non spécialisé voici ce qu'il faut lire: La "réunion" ou "union" des ensembles A et B consiste 
en l'ensemble des éléments qui se trouvent dans A et en plus dans B: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


203/4839 







Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


AuB 



Figure: 5.5 - Exemple visuel de la réunion 


Plus généralement, si (4 ) est une famille d'ensembles indexés par je/, l'union des (4 ) ,i e I est 
notée [J 4 . Cette réunion est définie par: 

ici 


|J 4 = (x/ 3i e / x e 4 } (5.61) 


ici 


C'est-à-dire que la réunion de la famille d'ensembles indexés comprend tous les x pour lesquels il existe 
un ensemble indexé par i tel que x soit inclus dans cet ensemble 4 . 

Nous avons les propriétés de distributivité suivantes: 

r 1 

LM n£ = LJ(4^) (5.62) 


2 */ 


2e/ 


2e/ 


f)4 (5.63) 


ici 


La loi de réunion u est une loi commutative (voir plus loin la définition du concept de "loi") telle que: 

AuB = BuA (5.64) 

Nous appelons par ailleurs "lois d'idempotences" les relations (précisons cela pour la culture générale): 

AnA = A 


AuA = A 


(5.65) 


et "lois d'absorptions" les lois: 


Ar l (AuB)=A 


(5.66) 


Au(AnB)=A 

Les lois de réunion et d'intersection sont associatives telles que: 

An(BnC) = (AnB)nC 
Au(BuC) = (iu5)uC 


(5.67) 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


204/4839 











Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

et distributives telles que: 


^n(5uC) = (j 4 n 5) u (j 4 n C) 
Au(BnC) = (.lu^n^uC) 


2.4. DIFFÉRENCE 


Dans le cas le plus simple, nous avons: 

j4\i? = {x|;rej4AxêZ?} (5.69) 

En langage non spécialisé voici ce qu'il faut lire: La "différence" des ensembles A et B consiste en 
l'ensemble des éléments qui se trouvent uniquement dans A (et qui excluent donc les éléments de B): 

À/B 



Figure: 5.6 - Exemple visuel de la différence 

Si nous nous rappelons du concept de "cardinal" (voir plus haut), nous avons avec les opérations 
précédemment définies, la relation suivante: 

Card (j4u5) = Card (j4) + Card(B) - Card(A n B) (5.70) 


d'où si AnB = 0- 


Card (Ju5) = Card (j4) + Card (B) (5.71) 

2,5. DIFFÉRENCE SYMÉTRIQUE 

Soit U un ensemble. Pour tout A, B ç U nous définissons la différence symétrique A/\P , entre A et B 
par: 


AAB = (A\B)u(B\A) (5.72) 

En langage non spécialisé voici ce qu'il faut lire: La "différence symétrique" des ensembles A et B 
consiste en l'ensemble des éléments qui se trouvent uniquement dans A et de ceux se trouvant 
uniquement dans B (nous laissons donc de côté les éléments qui sont communs): 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


205/4839 









Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

A&B 



Figure: 5.7 - Exemple visuel de la différence symétrique 

Les propriétés triviales sont les suivantes: 

PL AAB= BM 

P2. /\p ç = (pour la notion de complémentarité voir plus loin) 

P3. ^A5 = (^u5)\(,4n5) 

2.6. PRODUIT 


Dans le cas le plus simple, nous avons: 


AxB (5.73) 

En langage non spécialisé voici ce qu'il faut lire: "l'ensemble produit" (à ne pas confondre avec la 
multiplication ou le produit vectoriel) de deux ensembles A et B est l'ensemble des couples tels que: 

(x,y),xe A,ye B (5.74) 

L'ensemble produit des réels IR x IR par exemple forme le plan où chaque élément est défini par une 
abscisse et son ordonnée. Nous retrouvons souvent les ensembles produits en mathématiques et en 
physique lors que nous travaillons avec des fonctions. Par exemple, une fonction de deux variables 
réelles qui donne un réel en sortie sera noté: 

f(x,y) -ïz (515) 

mais cette notation n'est à ma connaissance pas normalisée et il en existe de nombreuses variantes. 
2.7. COMPLÉMENTARITÉ 


Dans le cas le plus simple, nous avons: 

\fA<zB Â = {x\xeB.xiA} (5 ' 76) 

En langage non spécialisé voici ce qu'il faut lire: Le "complémentaire" est défini comme en prenant B 
un ensemble et A un sous-ensemble de B alors le complémentaire de A dans B est l'ensemble des 
éléments qui sont dans B mais pas dans A. 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


206/4839 









Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

Par exemple, dans la figure ci-dessous nous avons le complémentaire de A par rapport à U qui est 
indiqué en gris (s'il est seul il s'agit donc de l'univers seul qui l'entoure): 



Figure: 5.8 - Exemple visuel de la complémentarité 

Une autre notation très importante de la complémentarité qu'on retrouve parfois dans la littérature est la 
suivante: 


U A C ou A e (5.77) 

où dans le cas particulier à droite ci-dessus, nous pourrions aussi écrire B!A (la notation U A serait 
rarement utilisée car elle peut prêter à confusion dans certaines situations). 

Nous avons comme propriétés pour tout A i inclus dans B: 




LM -rw 


2e/ 


2e/ 


H4 =LK 

^2e/ 2e/ 

Voici quelques lois triviales relatives aux compléments: 


(5.78) 


(5.79) 


2 = A 

An = 0 ( 5 - 80 > 

Au = U 

Il existe d'autres lois très importantes en logique booléenne. Si nous considérons trois ensembles A, B, C 
comme représentés ci-dessous: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


207/4839 












Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 



Figure: 5.9 - Exemple de trois ensembles particuliers 


nous avons donc: 


d\(5nC) = ( J 4\5)u( J 4\C) 
\ 5 \ C = (\ 5) u (n C) 


et les fameuses "lois de De Morgan" sous forme ensembliste (cf. chapitre de Systèmes Logiques 
Formels) et qui sont données par les relations: 


An B - A u B 
Au B = An B 


(5.82) 


3. FONCTIONS ET APPLICATIONS 


Définition: En mathématiques, une "application" (ou "fonction") notée f ou A est la donnée de deux 
ensembles, l'ensemble de départ E et l'ensemble d'arrivée F (ou d'image de E ), et d'une relation 
associant à chaque élément x de l'ensemble de départ un et un seul élément de l'ensemble d'arrivée, que 
nous appelons "image de x par/" et que nous notons/(x). 

Nous appelons "images" les éléments de f(E) et les éléments de E sont appelés les antécédents. 

Nous disons alors que/est une application de E dans F notée: 

f\E~>F (5.83) 

(se rappeler du premier diagramme sagittal présenté au début de ce chapitre), ou encore une application 
à arguments dans E et valeurs dans F. 


Remarque : Le terme "fonction" est souvent utilisé pour les applications à valeurs numériques, 
réelles ou complexes, c'est-à-dire lorsque l'ensemble d'arrivée est K ouC. Nous parlons alors de 
"fonction réelle", ou de "fonction complexe". 


Définitions: 

DI. Le "graphe" (ou encore "graphique" ou "représentative") d'une application / : E —> F est le 
sous-ensemble du produit cartésien E x F constitué des couples (x/(x)) pour x variant dans E. La 
donnée du graphe de/détermine son ensemble de départ (par projection sur la première composante 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


208/4839 













Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

souvent notée x) et son image (par projection sur la seconde composante souvent notée y). 

D2. Si le triplet / = (E,E,F) est une fonction où £ et F sont deux ensembles et r c £ x £ est un 
graphe, £ et £ sont respectivement la source et le but de/. Le "domaine de définition" ou "ensemble de 
départ" de/ est: 


D f = \xeE\3yeF, (x,y) e T} (5.84) 

D3. Etant donnés trois ensembles E,F etG (non vides), toute fonction de Ex F vers G est appelée "loi 
de composition" de £ x £ à valeurs dans G. 

D4. Une "loi de composition interne" (ou simplement "loi interne") dans E est une loi de composition de 
£ x £ à valeurs dans E (cas E=F=G). 


Remarque : La soustraction dans N n'est pas une loi de composition interne bien qu'elle fasse partie 
des quatre opérations élémentaires apprises à l'école. Par contre l'addition sur N en est bien une. 


D5. Une "loi composition externe" (ou simplement "loi externe") dans E est une loi de composition de 
£ x £ à valeurs dans E, où F est un ensemble distinct de E. En général, F est un corps, dit "corps de 
scalaires". 

Exemple: 

Dans le cas d'un espace vectoriel (voir définition beaucoup plus bas) la multiplication d'un vecteur 
(dont les composantes se basent sur un ensemble donné) par un réel est une loi de composition externe. 


Remarque : Une loi de composition externe à valeurs dans E est aussi appelée "action de F sur £". 
L'ensemble F est alors le domaine d'opérateurs. On dit aussi que F opère sur E (ayez en tête 
l'exemple des vecteurs précédemment cité). 


D6. Nous appelons "image de/', et nous notons Im(/), le sous-ensemble défini par: 


W) = /(fi) = {y e F 13* e B.y = /(*)} 


(5.85) 


Ainsi, "L'image" d'une application /:£—>£ est la collection des /(x) pour x parcourant E , c'est un 
sous-ensemble de F. 


Et nous appelons "noyau de/', et nous notons Ker(f), le sous-ensemble très important en 
mathématiques défini par: 


Ker(f) = f~ l i {0} i = 1 xe £ | /(x) = 0} 


(5.86) 


Selon la figure (il faut bien comprendre ce concept de noyau car nous le réutiliserons de nombreuses 
fois pour démontrer des théorèmes ayant des applications pratiques importantes): 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


209/4839 





















[SCIENCES.CH] 



tin{ f) image de / 


/ 


Figure: 5.10- Représentation du concept de noyau d'une fonction 


Remarques : 


RL Kerif) provient de l'allemand "Kern", signifiant tout simplement "noyau". En anglais, le noyau 
se dit aussi "kernel", signifiant "amande" dans le civil. 

R2. Normalement les notations Im et Ker sont réservées aux homomorphismes de groupes, 
d'anneaux, de corps et aux applications linéaires entre espaces vectoriels ou modules etc.... (voir 
plus loin). Nous n'avons normalement pas l'habitude de les utiliser pour des applications 
quelconques entre ensembles quelconques. Mais bon...ça ne fait rien. 


Les applications peuvent avoir une quantité phénoménale de propriétés dont voici celles qui font partie 
des connaissances générales du physicien (pour plus de renseignements sur ce qu'est une fonction, voir 
le chapitre traitant de l'Analyse Fonctionnelle). 

Soit/une application d'un ensemble E à un ensemble F alors nous avons les propriétés suivantes: 

PL Une application est dite "surjective" si: 

Tout élément y de F est l'image par/d'au moins (nous insistons sur le "au moins") un élément de E. 
Nous disons encore que c'est une "surjection" de E dans F. Il découle de cette définition, qu'une 
application/ : E —> F est surjective si et seulement si F = Irn / . En d'autres termes, nous écrivons 
aussi cette définition ainsi: 


Vy e F, e E y = /(x) (5-87) 


ce qui s'illustre par: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 











Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

S 


Figure: 5.11 - Représentation d'une fonction surjective 

P2. Une application est dite "injective" si: 

Tout élément y de F est l'image par/d'au plus (nous insistons sur le "au plus") un seul élément de 
E. Nous disons encore que/est une injection de E dans F. Il résulte de cette définition, qu'une 
application/ : E —» F est injective si et seulement si les relations x x , x 2 e E et / (jq ) = / (x 2 ) 

impliquent x 1 = x 2 autrement dit: une application pour laquelle deux éléments distincts ont des images 

distinctes est dite injective. Ou encore, une application est injective si l'une aux moins des propriétés 
équivalentes suivantes est vérifiée: 

P2.1 V(x,y)eE 2 /(*) = /<» =>* =j> 

P2.2 V(x,y)eE 2 x*y^f(x)*f(y) 

P2.3 Vv e F l'équation en x, y = j(x) a au plus une solution dans E 
Tout cela s'illustrant par: 



F 



Figure: 5.12 - Représentation d'une fonction injective 

P3. Une application est dite "bijective" si: 

Une application/de E dans F est à la fois surjective et injective. Dans ce cas, nous avons que pour tout 
élément y de F , l'équation y = /(x) admet dans E une unique (ni "au plus", ni "au moins") pré-image 
x. Ce que nous écrivons aussi: 


Vy t F, 3!ié£ y = / (x) (5.88) 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


211/4839 











Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

ce qui s'illustre par: 


E E 



Figure: 5.13 - Représentation d'une fonction bijective 


Nous sommes ainsi tout naturellement amené à définir une nouvelle application de F dans E, appelée 
"fonction réciproque" de/et notée / -1 , qui a tout élément y de F, fait correspondre l'élément x de E 

pré-image (ou solution) unique de l'équation y = f(x). Autrement dit: 


x = r\y) 


(5.89) 


L'existence d'une application réciproque implique que le graphique d'une application bijective (dans 
l'ensemble des réels...) et celui de son application réciproque sont symétriques par rapport à la droite 
d'équation y = x . 


Effectivement, nous remarquons que si y = f (x) est équivalent à x = f 1 (y ), alors ces équations 

impliquent que le point (x, y) est sur le graphique de/si et seulement si le point (y, x) est sur le 
graphique de / -1 . 

Exemple: 

Prenons le cas d'une station de vacances où un groupe de touristes doit être logé dans un hôtel. Chaque 
façon de répartir ces touristes dans les chambres de l'hôtel peut être représentée par une application de 
l'ensemble des touristes vers l'ensemble des chambres (à chaque touriste est associée une chambre). 

- Les touristes souhaitent que l'application soit injective, c'est-à-dire que chacun d'entre eux ait une 
chambre individuelle. Cela n'est possible que si le nombre de touristes ne dépasse pas le nombre de 
chambres. 

- L'hôtelier souhaite que l'application soit surjective, c'est-à-dire que chaque chambre soit occupée. 
Cela n'est possible que s'il y a au moins autant de touristes que de chambres. 

- S'il est possible de répartir les touristes de telle sorte qu'il y en ait un seul par chambre, et que toutes 
les chambres soient occupées: l'application sera alors à la fois injective et surjective nous dirons qu'elle 
est bijective. 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


212/4839 




















Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


Remarques : 

RL II vient des définitions ci-dessus qu'une application/est bijective (ou "biunivoque") dans 
l'ensemble des réels si et seulement si toute droite horizontale coupe la représentation graphique de 
la fonction en un seul point. Nous sommes donc amenés à faire la seconde remarque suivante: 

R2. Une application qui vérifie le test de la droite horizontale est continûment croissante ou 
décroissante en tout point de son domaine de définition. 


P4. Une application est dite "fonction composée" si: 


Soit <P une application de E dans F et 'F une fonction de F dans G. L'application qui associe à chaque 
élément x de l'élément de E, q/{q{x)) de G s'appelle "application composée" de <P et de 'F et se note: 


(5.90) 


où symbole " ° " est appelé "rond". Ainsi, la relation précédente s'écrit "psi rond phi" mais se lit "phi 
rond psi"... Ainsi: 


=<K<p(x)) 


(5.91) 


Soit, de plus, Z une application de G dans H. Nous vérifions aussitôt que l'opération de composition est 
associative: 


= (Z°Vd°P (5-92) 

Cela nous permet d'omettre les parenthèses et d'écrire plus simplement: Z 0 

Dans le cas particulier où serait une application de E dans E, nous notons q}' l'application composée 
<po<po...o<p (£ fois). 

Ce qui est important dans ce que nous venons de voir dans ce chapitre, c'est que toutes les propriétés 
définies et énoncées ci-dessus sont applicables aux ensembles de nombres. 

Voyons en un exemple très concret et très puissant: 

3.1. THÉORÈME DE CANTOR-BERNSTEIN 


Attention. Ce théorème, dont le résultat peut sembler évident, n'est pas forcément simple à aborder (son 
formalisme mathématique n'est pas très esthétique...). Nous vous conseillons de lire très lentement et de 
vous imaginer les diagrammes sagittaux dans la tête lors de la démonstration. 

Voici l'hypothèse à démontrer: Soient A et Y deux ensembles. S'il existe une injection (voir la définition 
d'une fonction injective ci-dessus) de X vers Y et une autre de Y vers X, alors les deux ensembles sont 
en bijection (voir la définition d'une fonction bijective ci-dessus). Il s'agit donc aussi d'une relation 
antisymétrique. 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


213/4839 










Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

Ce qui s'illustre par: 


X 



Figure: 5.14 - Représentation d’une relation antisymétrique 

Pour la démonstration, nous avons besoin en toute rigueur de démontrer au préalable un lemme 
(évident intuitivement mais pas formellement...) dont l'énoncé est le suivant: 

Soient X, Y, Z trois ensembles tels que JçZç Y ■ Si X et Y sont en bijection, alors X et Z sont en 
bijection. 

Un exemple d'application de ce lemme est l'ensemble des nombres naturels et des nombres rationnels 
qui sont en bijection. Dès lors, l'ensemble des entiers relatifs est en bijection avec l'ensemble des 
nombres naturels puisque: 


NçZçQ (5.93) 


Démonstration: 

D'abord, au niveau formel, créons une fonction/de YàX telle quelle soit bijective: 

f:Y^X (5.94) 

Nous avons besoin pour la suite d'un ensemble A qui sera défini par l'union des images des fonctions des 
fonctions/(du genre/(/(/’...))) ) des pré-images de l'ensemble Z dont nous excluons les éléments de 
X (ce que nous notons: Z-X). En d'autres termes (si la première forme n'est pas claire...) nous 
définissons l'ensemble A comme étant l'union des images de ( Z-X) par les applications / ° / °/... Ce 
que nous noterons : 


A=\Jf*(Z~X) (5.95) 

H-l 


Nous avons donc par construction AœX- Remarquons que nous avons aussi: 


A=[Jf n {Z-X^f(A) = f IJ f n 'Z-X* ={Jf(f n [Z-X)) = {Jf^(Z-X) (5.96) 




H=1 


H=1 


et en réindexant: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


214/4839 
























Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


f(A) = \Jf"[Z-X\ (5.97) 

72=2 


Nous avons alors (faire un schéma de tête des diagrammes sagittaux peut aider à ce niveau-là...): 

f((Z-X)uA) = A (5.98) 

Nous pouvons démontrer élégamment cette dernière relation: 


/((Z - X) u A) - /(Z - X) u/(4> - /(Z - X) u U/" (2 -X) - U/" (2 -JO - A 

X-2 H-l 

(5.99) 

Comme Z peut être partitionné (rien nous en empêche!) en les deux sous-ensembles disjoints 
(Z - X) u A et (X - A) sans oublier que X ç Z ç Y et AœX » nous posons comme une 
définition l'application g telle que: 

g:Z->X (5.100) 


tel que pour toute pré-image a nous ayons: 

Va e (Z - X) Uj4 i-^ f{a) (5.101) 

(rappelez-vous de la définition des applications notées "/') et: 

Va e (X - j4) h» a (5.102) 

L'application g est alors bijective car ses restrictions à (Z - X) u A et (X - A), (qui forment une 
partition) sont/et l'identité qui sont par définition bijectives. 

Finalement il existe bien, par construction, une bijection entre X et Z. 

□C.Q.F.D. 


Reprenons les hypothèses du théorème de Cantor-Bemstein: 
Soit <p une injection de X vers Y et une injection de Y vers X 
Nous avons alors: 


<p(X)<zY et ifXX)<zX (5.103) 


donc: 


ifAcp^X)) c ifXY) c X (5.104) 

Comme est injective, X et <p(X) sont par définition en bijection et de même, comme ■V est 
injective, iy(ç(X)) et ç(X) sont en bijection (là il est bon de relire...). 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


215/4839 






Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

Donc:Xet q/{cp(X)) sont eux aussi en bijection. 

En utilisant le lemme sur i/s($X)), q/(Y) et X, il vient donc que i/s(çx'Xj) est en bijection ys(X) ce qui 
nous donne avec ceux que nous avons vu juste précédemment, que puisque aussi q/{(p(X)) et <p(X) 
sont en bijection, alors que qAY) est en bijection avec <p(X ), alors X et Y sont en injection (ouf! c'est 
beau mais c'est aussi vicieux que simple). 


nC.Q.F.D. 

Ce théorème s'interprète de la manière suivante: Si nous pouvons compter une partie d'un ensemble 
avec la totalité des éléments d'un autre ensemble, et réciproquement, alors ils ont le même nombre 
d'éléments. Ce qui est évident pour des ensembles finis. Ce théorème généralise alors cette notion pour 
des ensembles infinis et c'est là sa force! 

À partir de là, ce théorème représente l'une des briques de base pour généraliser la notion de tailles 
d'ensembles à des ensembles infinis. 

4. STRUCTURES 


L'algèbre dite "algèbre moderne" commence avec la théorie des structures algébriques due en partie à 
Cari F. Gauss et surtout à Évariste Galois. Ces structures existent en un très grand nombre mais 
seulement les fondamentales nous intéresseront ici. Avant de les détailler, voici un diagramme 
synoptique de ces principales structures et de leur hiérarchie: 


Idéal *— Anneau 

I , 

Anneau intègre 

I 

Corps 


Magma 

I 

Monoide 

I 

Groupe 


Module 

1 

Espace vectoriel 

ï 

Algèbre —; 


Algèbre associative 


Figure: 5.15 - Diagramme synoptique des structures algébriques courantes 


Remarques : Tout en haut du diagramme, la structure au nombre minimal de contraintes, en bas, un 
maximum. Soit, plus nous descendons, plus la structure est en quelque sorte spécialisée. 


Soit pour simplifier les écritures, * une loi de composition (comme l'addition, la soustraction, la 
multiplication ou encore la division,...)... 


Remarque : Cette notation généralisée est parfois appelée "notation stellaire". 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


216/4839 









Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

Définitions: Soit * et ° des symboles de lois internes à un ensemble E (cela pourrait être l'addition et 
la multiplication pour prendre le cas le plus connu) alors: 

Dl. * est une "loi commutative" si: 


a *b - b*a (5.105) 


D2. * est une "loi associative" si: 


a *(è *c) = (a *&) *c (5.106) 


D3. n est "élément neutre" pour * si: 


a*n = n*a=a (5.107) 

Nous admettrons par ailleurs sans démonstration (c'est intuitif) que s'il existe un élément neutre, il est 
unique. 

D4. a' est "l'élément symétrique" (dans le sens général de l'opposé par exemple pour l'addition et 
l'inverse pour la multiplication) de a pour * si: 


a '*a = a *a ' = n (5.108) 

Nous admettrons également et sans démonstration que le symétrique de tout élément est unique. 
D5. ° est une "loi distributive" par rapport à *si: 

a o (& * c) = (a o b) * (a ° c) 

(5.109) 

(a *b ) oc = (a oc) * (£ oc) 

D6. b est "l'élément absorbant" si pour tout a et une loi * nous avons: 

a*b= 0 (5-110) 


Remarques : 

RL Si a est son propre symétrique par rapport à la loi *, les mathématiciens disent que a est 
"involutif". 

R2. Si un élément b de E vérifie a*b = b*a = b, alors b est dit "élément absorbant" pour la loi *. 

R3. Il faut toujours vérifier que les neutres et les symétriques le soient "à gauche" et "à droite". 
Ainsi, par exemple, dans (Z, -), l'élément 0 n'est un neutre qu'à droite car x - 0 = x mais 

0 - x= -x. 

4.1. MAGMA 


Définition: Nous désignons un ensemble par le terme "magma" M , si les composants le constituant 
sont opérables par rapport à une loi interne * : 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


217/4839 








Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

f* est une opération 
f M,*) est un magma si => ^ 

]* est une loi interne 

Remarques : 

RI. Si de plus la loi interne * est commutative, nous parlons de "magma commutatif'. 

R2. Si de plus la loi interne * est associative, nous parlons de "magma associatif'. 

R3. Si de plus la loi interne * possède un élément neutre, nous parlons de "magma unitaire". 

Il est donc important de se rappeler que si nous désignons une structure algébrique par le terme 
"magma" tout court, cela ne signifie en aucun cas que la loi interne est commutative, associative ou 
même qu'elle possède un élément neutre ! 

Définition: Dans un magma (M,*) , un élément x est dit "élément régulier" (ou "élément simplifïable") 
à gauche si pour tout couple ( a,b ) e M nous avons: 

x*a = x*b =>a =b (5.111) 


Remarque : Nous définissons de même un élément régulier à droite. 


Ainsi, un élément est dit "régulier" s'il est régulier à droite et à gauche. Si * est commutative (ce qui est 
le cas pour un magma commutatif), les notions d'élément régulier à gauche ou à droite coïncident. 

Exemple: 

Dans (N, +) tout élément est régulier et dans (N,x) tout élément non nul est régulier. 

Un magma (M ,'*) est donc une structure algébrique élémentaire. Il existe des structures plus subtiles 
(monoïdes, groupes, anneaux, corps, espace vectoriels, etc.) dans lesquelles un ensemble est muni de 
plusieurs lois et de différentes propriétés. Nous allons les voir de suite et les utiliser tout au long de ce 
site. 

4.2. MONOÏDE 


Définition: Si la loi * est associative et possède un élément neutre nous disons alors que le "magma 
associatif unitaire" est un "monoïde": 



est un monoïde si 


* est associative 

* Il existe dans M un élément neutre n pour * 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


218/4839 

















Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

Remarques : 

RI. Si de plus la loi interne * est commutative alors nous disons alors que la structure forme un 
"monoïde abélien" (ou simplement "monoïde commutatif'). 

R2. Dans certains ouvrages nous trouvons aussi comme définition que le monoïde est un "demi- 
groupe" (avec une loi associative) muni d'un élément neutre. 


Montrons tout de suite que l'ensemble des entiers naturels N est un monoïde abélien totalement 
ordonné (comme nous l'avons partiellement vu dans le chapitre des opérateurs) par rapport aux lois 
d'addition et de multiplication: 

La loi d'addition ( + ) est-elle une opération interne telle que Va, à e N nous ayons: 


a+b=c ( 5 . 112 ) 

Nous pouvons démontrer que c'est bien le cas en sachant que 1 appartient à N tel que: 

È 1+ É 1= Z 1 ( 5 - 113 > 

i-l i-1 z-1 

Donc ceN et l'addition est bien une loi interne (nous disons également que l'ensemble N est "stable" 
par rapport à l'addition) et en même temps associative puisque 1 peut être additionné à lui-même par 
définition dans n'importe quel ordre sans que le résultat en soit altéré. Si vous vous rappelez que la 
multiplication est une loi qui se construit sur l'addition, alors la loi de multiplication ( x ) est aussi une 
loi interne et associative ! 


Nous admettrons à partir d'ici qu'il est trivial que la loi d'addition est également commutative et que le 
zéro "0" en est l'élément neutre ( n ). Ainsi, la loi de multiplication est elle aussi commutative et il est 
trivial que "1" en est l'élément neutre (n). 

Par ailleurs, pour parler déjà de quelque chose qui n'est pas directement en relation avec le monoïde... 
mais qui nous sera utile un peu plus loin, existe-t-il en restant dans la lignée de l'exemple précédent 
pour la loi d'addition ( + ) un symétrique 3c tel que Va.ie N nous ayons: 


r a £ 



■b-te 

^ 2-1 2-1 

} K 1 - 1 } 


+ c = 0 


( 5 . 114 ) 


avec c e N ? 


Il est assez trivial que pour que cette égalité soit satisfaite nous ayons: 


Ig 1 


= -C 


( 5 . 115 ) 


soit: 


a + b = -c (5.116) 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


219/4839 












Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

or les nombres négatifs n'existent pas dans N • Ce qui nous amène aussi à la conclusion que la loi 
d'addition ( + ) n'a pas de symétrique et que la loi de soustraction ( - ) n'existe pas dans N (la 
soustraction étant rigoureusement l'addition d'un nombre négatif). 

De même, car cela va aussi nous être utile un peu plus loin, existe-t-il pour la loi de multiplication ( x ) 
un symétrique a' tel que Va e N nous ayons: 

a'-a-n-l (5.117) 


avec a'eN? 

D'abord il est évident que: 


a' = - (5.118) 

a 

Mais excepté pour a = 1, le quotient Ma n'existe pas dans N . Donc nous devons conclure qu'il n'existe 
pas pour tout élément de N de symétriques pour la loi de multiplication et ainsi que la loi de division 
n'existe pas dans N et que la loi de multiplication ne forme pas un monoïde dans cet ensemble. 

Synthèse: 


N (lois) 

(+) 

(-) 

(N> || 

(/) 

Opération interne 

oui 

non 

oui 

non 

Commutative 

oui 

oui 

Élément neutre 

oui 

(zéro "0") 

oui 

(un "1") 

Élément absorbant 

non 

oui 

(zéro "0") 

Symétrique 

non 

non 


Tableau: 5.1 - Lois et leurs propriétés dans l’ensemble des entiers naturels 


Nous avons par exemple les propriétés suivantes relativement à l'ensemble des entiers naturels et au 
concept de monoïde: 

PI. (N, <, >) est totalement ordonné (attention cette notation est un peu abusive! il suffit qu'il y ait 
juste une des deux relations d'ordre R pour que l'ensemble soit totalement ordonné). 

P2. (N, +) et (N,x) sont des monoïdes abéliens. 

P3. L'élément zéro "0" est l'élément absorbant pour le monoïde (N,x). 

P4. Les lois de soustraction et division n'existent pas dans l'ensemble N . 

P5. N est un monoïde abélien totalement ordonné par rapport aux lois d'addition et de multiplication 
(attention la notation suivante est abusive car le monoïde n'est composé que d'une seule loi interne et 
d'une relation d'ordre R ce qui donnerait au total 4 monoïdes): 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


220/4839 






























Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

(N,+,x< ; >) (5.119) 


Remarques : 

RI. Il est rare d'utiliser les monoïdes; car souvent, lorsque nous nous trouvons face à une structure 
trop pauvre pour pouvoir vraiment discuter, nous la prolongeons vers quelque chose de plus riche, 
comme un groupe, ou un anneau (voir plus loin) tel que l'ensemble des entiers relatifs. 

R2. Dire qu'une structure algébrique est totalement ordonnée par rapport à certaines lois signifie 
que soit * une loi, et R une relation d'ordre et a , b, c, d quatre éléments de la structure intéressée, 
alors si aRb et cRd implique (a *c)R(b *d ). Nous notons alors cette structure (S,*, R) ou 
simplement (S,R) et en indiquant la (ou les) loi concernée. 


4,3. GROUPES 


Définition: Nous désignons un ensemble par le terme "groupe", si les composants le constituant 
satisfont aux trois conditions de ce que nous nommons la "loi interne de groupe", définie ci-dessous: 

{ * est associative 

Il existe dans G un élément neutre pour * 

Tout élément de G possède un symétrique pour * 

Dans ce cas, la loi de compositions interne * sera souvent (mais pas exclusivement!) notée "+" et 
appelée "l'addition", le neutre e noté "0" et le symétrique de x noté ”-x”. 

Insistons sur le fait que la structure de groupe est probablement une des plus importantes dans la 
pratique de l'ingénieur et de la physique moderne en général. Raison pour laquelle il convient d'y porter 
une attention toute particulière (cf. chapitre d'Algèbre Ensembliste)! 

Si de plus, la loi interne * est également commutative, nous disons alors que le groupe est un "groupe 
abélien" ou simplement "groupe commutatif'. 

S'il existe dans G au moins un élément a tel que tout élément de G est une puissance de a ou du 
symétrique a' de a, nous disons que (G, *) est un "groupe cyclique de générateur a" s'il est fini, sinon 
nous disons qu'il est "monogène" (nous reviendrons sur les groupes cycliques dans le chapitre d'Algèbre 
Ensembliste). 

Plus généralement un groupe (G; *) d'élément neutre e , non réduit uniquement à {e} sera monogène, 
s'il existe un élément a de G distinct de e tel que G = a 1 ,a 2 , a 3 ,...,a” ,.. .J . Un tel groupe sera 

cyclique, s'il existe un entier n non nul pour lequel a x = s ■ Le plus petit entier non nul vérifiant cette 
égalité est alors "l'ordre du groupe". 

Exemple: 

Montrons tout de suite que l'ensemble des entiers relatifs Z est un groupe abélien totalement ordon n é 
(comme nous l'avons vu dans le chapitre des Opérateurs) par rapport aux lois d'addition et de 
multiplication. 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


221/4839 










Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

D'abord pour raccourcir les développements, il est utile de rappeler que l'ensemble Z est un 
"prolongement" de N par le fait que nous y avons ajouté tous les nombres symétriques de signe négatif 
( N cZ). 

Ainsi, en abusant toujours des notations (car normalement un groupe n'a qu'une seule loi et une seule 
relation d'ordre R suffit à l'ordonner): 

(Z; +,-,<,>) (5.120) 

forme un groupe abélien totalement ordonné (4 groupes au fait!) et: 

(Z;x,<, >) (5.121) 

un monoïde abélien (deux monoïdes au fait!) totalement ordonné. 

Remarquons aussi que la loi de division n'existe pas pour tout élément de l'ensemble Z ! Donc en toute 
généralité nous disons qu'elle n'y existe pas. 

Synthèse: 


Z (lois) 

(+) 

(-) ■ 

(X) 

(/) 1 

Opération interne 

oui 

oui 

oui 

non 

Associative 

oui 

non 

oui 

Commutative 

oui 

non 

oui 

Élément neutre 

oui 

(zéro "0") 

non 

(0 pas neutre à gauche) 

oui 

(un "1") 

Élément absorbant 

non 

non 

oui 

(zéro "0") 

Symétrique 

oui 

(signe opposé) 

oui 

non 


Tableau: 5.2 - Lois et leurs propriétés dans l'ensemble des entiers relatifs 


Nous avons donc les propriétés suivantes: 

PI. (Z; <, >) est totalement ordonné (attention à nouveau cette notation est un peu abusive! il suffit 
qu'il y ait juste une des deux relations d'ordre R pour que l'ensemble soit totalement ordonné). 

P2. (Z; +) est un groupe commutatif dont zéro "0" est l'élément neutre. 

P3. La loi de division n'existe pas dans l'ensemble Z • 

P4. L'ensemble Z est un groupe abélien totalement ordonné par rapport à la loi d'addition (attention la 
notation suivante est encore une fois abusive car le groupe est composé que d'une relation d'ordre R ce 
qui donnerait au total 2 groupes): 


(Z;+,<, >) (5.122) 

L'ensemble Z n'est pas un groupe commutatif totalement ordonné par rapport à la loi de multiplication: 

[Vincent ISOZ] | http://www.sciences.ch] | Page: 


222/4839 






















Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

(Z;X,<,>) (5.123) 

Nous voyons de suite alors que Z a des propriétés trop restreintes, c'est la raison pour laquelle il est 
intéressant de le prolonger par l'ensemble des rationnels (Q défini de manière très simpliste... par (cf. 

chapitre sur les Nombres): 



(p,q)e Z /q = 0 


} 


(5.124) 


Ce qui signifie pour rappel que l'ensemble des rationnels est défini par l'ensemble des quotients p et q 
appartenant chacun à Z dont nous excluons à q de prendre la valeur nulle (la notation lq signifiant 
l'exclusion). 


Et nous avons évidemment: 


N,ZcQ (5.125) 

Il est dès lors évident (sans démonstration et toujours en utilisant la notation abusive déjà commentée 
maintes fois plus haut...) que (Q, <, >) est aussi totalement ordonné et aussi que Q est un groupe 
abélien totalement ordonné par rapport à la loi d'addition seulement: 

(CQ;+,> <) (5.126) 

Ce qui devient intéressant avec Q, c'est que la loi de multiplication devient une loi interne et forme un 
groupe abélien commutatif dit "groupe multiplicatif' par rapport à Q*. 

Démonstration: 

Démontrons donc que le symétrique existe pour la loi de multiplication (.) tel que: 

a-a' = n = 1 (5.127) 

Puisque dans Q* tout nombre peut se mettre sous la forme: 


avec p e Z ,q e Z* . 


a = — (5.128) 

? 


Alors puisque: 



a 



p (5.129) 


Il existe donc un symétrique à tout rationnel dans Q* pour la loi de multiplication. 


□C.Q.F.D. 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


223/4839 










Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

Par définition, ou par construction, la division existe dans Q* et est une opération interne. Mais est-elle 
associative telle que pour \fp r q,r,e Q* nous ayons: 

(p/q)/r = pl(qlr) (5.130) 


Démonstration: 

Au fait, la démonstration est assez triviale si nous nous rappelons que la division se définit à partir de la 
loi de multiplication par l'inverse et que cette dernière loi est (elle!) associative. Ainsi, il vient: 


(p!q)fr = 


11 

1 

T.r 


1 1 

( il 

P'- 

'- = P' 


= p 


*pKçtr)=pi\<r- 

1 \ 

r 




{ n 


P ■- (5.131) 

? 


Donc la loi de division n'est pas associative dans Q*. 


□C.Q.F.D. 

Nous pouvons aussi nous demander si la loi de division ( / ) est cependant commutative tel que la 
relation: 

al b = b/a (5.132) 


pour \f a ,b e<Q*? 

Nous voyons très bien que cela n'est pas le cas puisque nous pouvons écrire cette dernière relation sous 
la forme: 


— = —= ±1 =>a-±b (5.133) 

b a 


Synthèse: 


Q (lois) 

(+) 

(-) 

(x) 

(/) 

Opération 

interne 

oui 

oui 

oui 

oui 

Associative 

oui 

non 

oui 

non 

Commutative 

oui 

non 

oui 

non 

Élément neutre 

oui 

(zéro "0") 

non 

(0 pas neutre à gauche) 

oui 

(un "1") 

oui 

("1" neutre à droite) 

Élément abs. 

non 

non 

oui 

(zéro "0") 

oui 

("0" au numérateur) 

Symétrique 

oui 

(signe opposé) 

oui 

(signe opposé) 

non 

(excepté dans Q* ) 

non 


Tableau: 5.3 - Lois et leurs propriétés dans l’ensemble des rationnels 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


224/4839 






































[SCIENCES.CH] 


Nous avons donc les propriétés suivantes: 


PI. (Q; <, >) est totalement ordonné 


P2 - (Q;+),(Q* ; x) sont indépendamment des groupes abéliens totalement ordonnés 
P3. Zéro "0" est l'élément absorbant par rapport au groupe (Q*,x) 


P4. L'ensemble (Q> est un groupe abélien totalement ordonné par rapport aux lois d'addition et de 
multiplication que nous notons: 


(Q;+,> <) et <) (5.134) 


Les mêmes propriétés sont applicables à 1 et à <C mais à la différence que ce dernier n'est pas 
ordonnable. 

Cependant, il peut être compréhensible que pour tC vous soyez sceptiques. Développons donc tout 
cela: 

Nous devons nous assurer que la somme, la différence, le produit et le quotient de deux nombres de la 
forme x +iy donne quelque chose d'encore de cette forme. 

Additionnons les nombres a+ib et c + id où a, b,cetd sont des réels: 


(a + ib ) + (c +id) = a +ib + c +id = a + c +ib + id = (a + c) + i(b + d) (5.135) 


Donc l'addition est bien une loi interne commutative et associative pour laquelle il existe un élément 


neutre et symétrique dans l'ensemble des complexes. 

Soustrayons les nombres a+ib et c +id où a, b, c et d sont ici encore, des réels: 

{a + ib) - (c + id) = a + ib ~c ~id = a~c + ib ~id = (a ~c) + i(b - d) (5.136) 

Donc la soustraction est une opération interne; elle n'est ni commutative, ni associative elle n'a pas 
d'élément neutre à gauche et pas de symétrique. 

Multiplions maintenant les nombres a+ib ^ t c +id où a, b, c et d là toujours, des réels. Pour 
parvenir à nos fins, nous emploierons la distributivité de la multiplication par rapport à l'addition. 


(a + ib)(c +id ) = a 1 c + a i i' d +i • b‘ c +i • b i i • d 
= a - c + i‘ a' d + i' b ■ c +i 2 ■ b - d 

= a ■ c + i ■ a ■ d + i • b ■ c + (~V) ■ b ■ d = (a • c ~ b ■ d) + i(a • d + b ■ c) 


(5.137) 


Donc la loi de multiplication est bien une opération interne commutative, associative et distributive (!) 
pour laquelle il existe un élément neutre et symétrique dans (voir ci-après) dans l'ensemble des 
complexes. 

Une division est avant tout une multiplication par l'inverse. Prouver qu'il existe un inverse c'est prouver 
qu'il existe un symétrique pour la multiplication. Inversons donc le nombre x +iy où x et y sont des 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 







Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


réels (différents de zéro): 



1__ (x ~ ?» _ _ x ~ iy _ x _ y_ 


Donc l'inverse d'un nombre complexe est bien une opération interne non associative et non 
commutative pour laquelle il existe un élément neutre, et elle est symétrique. Il en est de même pour la 
division, qui correspond au produit par l'inverse d'un nombre complexe. 

Voyons un exemple de groupe cyclique: Dans (C, considérons G={l,i,-l,-i} muni de la multiplication 
usuelle des nombres complexes. Alors ( G,x ) est évidemment un groupe abélien. Un tel groupe est aussi 
monogène car engendré par les puissances d'un de ses éléments: i (ou bien -/). Ce groupe monogène 
étant fini, il s'agit alors d'un groupe cyclique. 

4.4. ANNEAUX 

L'anneau est le coeur de l'algèbre commutative qui est la structure algébrique correspondant aux 
concepts collégiens d'addition, de soustraction, et de multiplication. 

Définition: Un groupe commutatif (ou "groupe abélien") A est un "anneau" s'il est muni d'une seconde 
loi de composition interne vérifiant les propriétés suivante: 



Comme nous le savons déjà, l'élément neutre de la première loi de composition interne + est noté "0" et 


appelé "zéro" de l'anneau. La deuxième loi interne est souvent notée par un point à mi-hauteur et 
appelée la "multiplication". 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 














Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


Remarques: 

RI. Si de plus, la deuxième loi interne de composition * est également commutative, l'anneau est 
dit "anneau commutatif'. Nous rencontrons aussi des anneaux non-commutatifs dans lesquels la 
relation de commutativité n'est pas imposée ou ne s'impose pas et alors nous devons parfois 
l'imposer, il faut alors renforcer la propriété de l'élément neutre de cette deuxième loi en imposant à 
"1" d'être un élément neutre à la fois à droite et à gauche tel que: la = al = a (un exemple d'anneau 
non-commutatif est fourni par l'ensemble des matrices nxn à coefficients dans un anneau A, par 
exemple M s i IR > - voir chapitre d'Algèbre Linéaire). 

R2. Si de plus, il existe dans A un élément neutre pour la deuxième loi de composition interne *, et 
que cet élément neutre est l'unité "1" nous disons alors que l'anneau est un "anneau unitaire" et 1 
est appelé "unité" de l'anneau. Si l'anneau est commutatif et possède un élément neutre pour la 
deuxième loi de composition interne alors nous parlons "d'anneau commutatif unitaire" 

R3. Si a = 0 => (a = 0 ou b = 0), quels que soient les éléments a,b de A, l'anneau est dit "anneau 
intègre" ou "anneau sans diviseurs de zéro" (dans le cas contraire il est bien évidemment "non 
intègre"). 

R4. Un "anneau factoriel" est un anneau commutatif unitaire et intègre dans lequel le théorème 
fondamental de l'arithmétique (cf. chapitre de Théorie des Nombres) est vérifié. 


Définitions: 

Dl. Un élément a d'un anneau^ est un "élément unité" s'il existe b e A tel que ah = ha = 1 ■ Si un tel b 
existe il est unique (nous en avons vu un exemple lors de notre étude des classes de congruence en 
théorie des nombres). 

D2. Soit A un anneau. Nous disons que A possède des diviseurs de zéro s'il existe a,b e A avec 
a * 0,b ^ 0 et a b = 0 ■ Les éléments a et b sont appelés des "diviseurs de zéro". 


Remarques : 

Rl. Il est clair qu'un anneau est intègre si et seulement si il ne possède aucun diviseur de zéro. 

R2. Les notions d'unité et de diviseurs de zéro sont incompatibles mais un élément d'un anneau peut 
être ni l'un ni l'autre. C'est le cas, par exemple, de tous les entiers * {0, -1,1} dans Z • Ce ne sont ni 
des unités, ni des diviseurs de zéro. 


Nous verrons un exemple important d'anneau dans le cadre de notre étude des polynômes (cf. chapitre 
de Calcul Algébrique) mais nous en avons déjà vu de très importants lors de notre étude des classes de 
congruence dans le chapitre de théorie des nombres. 

Voyons quelques exemples d'anneaux: Lors de notre étude des groupes nous avons trouvé que les 
structures: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


227/4839 















Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

(Z,+),(Q,+),(IR,+),(<C,+) (5.139) 

sont tous les quatre des groupes abéliens et les trois premiers sont en plus totalement ordonnés. 

La loi de division n'étant en aucun cas associative, nous pouvons nous restreindre à étudier pour chacun 
des groupes précités, le couple de lois: (+) et ( x ). 

Ainsi, il vient très vite que: 

(Z; +;x), (Q; +; x), (IR; +;x), (<C; +;x) (5.140) 


constituent des anneaux commutatifs unitaires et intègres. 


Remarque : Nous considérerons comme évident, à ce niveau du discours, que le lecteur aura 
remarqué que est Z un "sous-anneau" de Q dans le sens où les opérations définies sont internes à 
chacun des ensembles et que les éléments neutres et identité sont identiques et qu'il existe pour 
chaque élément de ces ensembles un opposé qui est dans le même ensemble. Nous allons 
approfondir le concept de sous-anneau un peu plus loin. 


Soit A un anneau. Nous avons les propriétés suivantes: 

PI. a + b = a + c => (ù = c) Va,ù,cej4 

P2. 0 ■ a = 0 Va e A 
P3. (-1) 1 a = ~a Va E A 

Démonstrations: 

DM1. La propriété PI découle de la définition D4 vu tout au début de la partie concernant les 
structures algébriques (tout élément possède un opposé/symétrique). En effet, nous pouvons 
additionner à l'égalité a + b = a + c l'élément -a. Nous obtenons alors (-a) + a +b = (-a) + a +c par 
l'existence de l'opposé cela donne 0 + b = 0 + c d'où b = c ■ 

DM2. La propriété P2 découle des définitions D3 (existence de l'élément neutre), D4 (existence de 
l'opposé/symétrique), D5 (distributivité par rapport à l'autre loi) ainsi que de la propriété PI ci-dessus. 
En effet, nous avons: 


0 , a + a = 0 , a+l , a = (0 + l) , a = l , a = a (5.141) 

Nous avons donc 0 a + a = a. La propriété P1 ci-dessus permet de conclure que 0 a = 0 (nous 
pourrions discuter de la pertinence de ce genre de démonstration...). 

DM3. La propriété P3. se montre à l'aide de P2. Nous avons: 

0 = 0 • a = (1 + (-1)) • a = 1 • a + (-1) ■ a (5.142) 

en ajoutant -a à cette dernière égalité, nous avons: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


228/4839 









Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


~a = (-!)■ a (5.143) 


nC.Q.F.D. 


4.4.1. SOUS-ANNEAU 


Définition: Soit A un anneau et S A un sous-ensemble de A. Nous disons que S est un "sous-anneau" 
de A si: 

PI. n e B (élément neutre de A est aussi celui deS) 

P2. a e S => -a e S 
P3. a,bES=>a + bES 
P4. a,bE S => a • bE t ? 

Exemple: 

L'anneau Z est un sous-anneau de 
4,5. CORPS 

Définition: Nous désignons un ensemble de nombres par le terme "corps" si: 



Donc un corps est un anneau non nul dans lequel tout élément non nul est inversible ou en d'autres 
termes: un anneau dont tous les éléments non nuis sont des unités est un corps. 

Remarques : 

RI. Si la loi interne * est également commutative, le corps est dit "corps commutatif'. 

R2. Les quatemions (cf. chapitre sur les Nombres) forment par exemple un corps non commutatif 
pour l'addition et la multiplication. 

Voyons des exemples de corps parmi les anneaux unitaires suivant: 



Il nous faut d'abord déterminer lesquels ne constituent pas des groupes par rapport à la loi interne de 
multiplication ( x ). 


Comme nous l'avons déjà vu dans notre étude des groupes précédemment, il est évident qu'il nous faut 


éliminer (Z; +; x) à cause de l'existence des inverses qui n'est pas assurée dans cet ensemble. 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 











Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

Ainsi, les corps fondamentaux de l'arithmétique sont: 


(Q;+;x),(IR;+;x),(C;+;x) (5.145) 

et puisque la loi de multiplication ( x ) est commutative dans ces ensembles, nous pouvons affirmer que 
ces corps sont également des corps commutatifs. 

Nous avons souvent dans les petites classes le schéma suivant pour le corps le plus important: 


L'addition est une opération interne 
L'addition est associative 
(IR;+) < L'addition est commutative 
commutatif ^ sxi s te un élément neutre pour l'addition: 0 
Tout nombre réel possède un opposé 

La multiplication est une opération interne 
La multiplication est associative 
La multiplication est commutative 
Il existe un élément neutre pour la multiplication: 
Tout nombre réel non nul possède un inverse 
La multiplication est distributive par rapport à l'addition 


(K*;x) • 

gioupe 

commutatif 


>(!R;+;x) 


1 


coips 

commutatif 


>(IR;+;x) 


corps 

commutatif 

totalement 

ordonné 


(K;<) 

ensertiile 

totalement 

ordonné 


La relation 
< La relation 
La relation 


< est réflexive 

< est anti symétrique 

< est transitive 


Figure: 5.16 - Propriétés classique de l'ensemble des réels 

Ainsi, nous appellerons "corps" un système C de nombres réels ou complexes a tels que la somme, la 
différence, le produit et le quotient de deux quelconques de ces nombres a appartiennent au même 
système C. 

Nous énonçons également cette propriété de la manière suivante: les nombres d'un corps se 
reproduisent par les opérations rationnelles (addition, soustraction, multiplication, division). Ainsi, il est 
évident que le nombre zéro ne pourra jamais former le dénominateur d'un quotient et l'ensemble des 
entiers ne peut former un corps car la division dans l'ensemble des nombres entiers ne donne pas 
nécessairement un résultat dans ce même ensemble. 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


230/4839 











Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


4.6. ESPACES VECTORIELS 

Lorsque nous définissons un "vecteur" (cf. chapitre de Calcul Vectoriel), nous faisons habituellement 
référence à un "espace euclidien" (cf. aussi chapitre de Calcul Vectoriel) de n dimensions de ir k . 
Cependant, la notion d'espace vectoriel est beaucoup beaucoup plus vaste que ce dernier qui ne 
représente qu'un cas particulier. 

Définition: Un "espace vectoriel (EV)" ou "if-espace vectoriel" (abrégé: if-ev) sur le corps K (nous 
prendrons fréquemment pour ce corps ou (D) est un ensemble (E, +,*) possédant les propriétés: 



(E, +) est un groupe abélien 



Ex K —» E 
(. x,a ) —> a *x 


est une loi externe définie par: 


Nous avons donc deux lois de composition (en prenant les notations traditionnelles des vecteurs qui 
sera peut-être plus parlante et utile pour la suite...): 

1. Une loi de composition interne: l'addition notée + qui vérifie: 

1.1. Associativité: ^x,y,z e E : (x + y) + z = x + [y + z) 

1.2. Commutativité: Vx,yeE: x+ y - y + x 

1.3. Élément neutre: 30 e E : Vx e E,x + 0 = x 

1.4. Élément opposé: Vxe E,3x'e E: x + x'=0 

2. Une loi de composition externe: la multiplication par un scalaire, notée , qui vérifie: 

2.1. Associativité: eK,Vx e E : â (^ x)=(â ^) x 

2.2. Distributivité à droite par rapport au corps K: V A, fi e K, Vif e E : (A + pi) • x - A x+^ x 

2.3. Distributivité à gauche par rapport à E : V.î e K, Vz,y e E : A ■ (x+y) = A ■ x+ A y 

2.4. Élément neutre (de K sur E): Vx e E : 1 ■ x = x 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 








Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


Remarques: 

RI. Nous disons alors que l'espace vectoriel a une "structure algébrique vectorielle" et que ces 
éléments sont des "vecteurs", les éléments de K des "scalaires". 

R2. Les opérations respectives s'utilisent fréquemment comme l'addition et la multiplication que 
nous connaissons déjà très bien sur ffi», ce qui est bien commode pour nos habitudes.... 

R3. Dorénavant, pour distinguer les éléments du corps K et de l'ensemble E, nous noterons ceux de 
K par des lettres grecques et ceux de E par des lettres latines majuscules. 

R4. Outre les cinq propriétés énumérées ci-dessus, il ne faut pas oublier d'ajouter les cinq autres 
propriétés du groupe abélien (opération interne, commutativité, associativité, élément neutre, 
élément inverse). Ce qui nous fait donc au total dix propriétés à respecter. 


Il est inutile de démontrer que ces propriétés sont respectées pour et, par conséquent pour jj 2 . 
Nous pouvons cependant nous poser la question à propos de certains sous-ensembles de k* . 

Exemples: 

El. Considérons la région rectangulaire illustrée dans la figure (a) et en perspective dans la figure (c) 
ci-dessous: 



Ce sous-ensemble de k 2 n'est pas un espace vectoriel car, entre autres, la propriété d'opération interne 
du groupe abélien n'est pas satisfaite. En effet, si nous prenons deux vecteurs à l'intérieur du rectangle 
et que nous les additionnons, il se peut que le résultat sorte du rectangle. Par contre, il est facile de voir 
que la droite (infinie) illustrée dans la figure (b) respecte toutes les propriétés énumérées précédemment 
et, par conséquent, défini un espace vectoriel. Notons bien, cependant, que cette droite se doit de 
passer par l'origine, sinon la propriété d'élément neutre du groupe abélien ne serait pas respectée 
(l'élément neutre n'existant plus). 

E2. Un autre exemple d'un espace vectoriel est l'ensemble p 2 des polynômes de degré deux ou moins 
(cf. chapitre de Calcul Algébrique). Par exemple, deux éléments de cet espace sont: 

x=t 2 +2t +3 

(5.147) 

y = ~t +5 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


232/4839 





















Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

Cet ensemble respecte les 10 propriétés d'un espace vectoriel. En effet, si nous additionnons deux 
polynômes de degré deux ou moins, nous obtenons un autre polynôme de degré deux ou moins. Nous 
pouvons aussi multiplier un polynôme par un scalaire sans changer l'ordre (ou degré) de celui-ci, etc. 
Nous pouvons donc représenter un polynôme par des vecteurs dont les termes sont les coefficients du 
polynôme. 

Mentionnons que nous pouvons aussi former des espaces vectoriels avec des ensembles de fonctions 
plus générales que des polynômes. Il importe seulement de respecter les dix propriétés fondamentales 
d'un espace vectoriel ! 

Ainsi défini, un espace vectoriel E sur K est une action de K * sur ( E, +) qui est compatible avec la loi 
de groupe (par extension un "automorphisme" - voir la définition plus loin - sur ( E, +) ). 

Définition: Soit E un espace vectoriel, nous appelons "sous-espace vectoriel" (SEV) F de E un 
sous-ensemble de E si et seulement si (notation des matheux): 

F * 0 

ViXJie F 2 ,X + Y<e F (5.148) 

VÂe K,VXeF,AXeF 

ou en utilisant une autre notation (celle utilisée plutôt par les physiciens): 

F= 0 

V(x,ÿ)eF 2 ,x+ye F (5-149) 

V/l e K,Vx e F,Axe F 


4.7. ALGÈBRES 

Une "C-algèbre A" où C est un corps commutatif (appelée aussi souvent "A-alègbre A” pour "Kôrper" 
en allemand)), est un ensemble A muni de deux lois de composition internes + (addition) et x (produit) 
et d'une loi externe (multiplication) à domaine d'opérateurs C (produit par un scalaire) si et seulement 
si: 


(A, C,+, -,x) est une 


C-algèbre si => 


(j 4,+,-) est un C-espace vectoriel 
< (21,+, x) est un anneau unitaire 
yAeC,Va,beA,{àa)-b = a-(Ab) = Â(a-b) 


(5.150) 


Exemples: 

El. Pour reprendre un exemple dans la lignée de celui sur les exemples vectoriels, l'espace euclidien 
Ig 3 muni de l'addition (+), de la multiplication (•) et du produit vectoriel (x) est une IR -algèbre non 

associative et non commutative notée ( IR 3 , IR, +, - , x ). 


E2. C est une iR-algèbre (un nombre complexe pouvant être vu comme un vecteur à deux composantes 
selon ce que nous avons vu dans le chapitre des Nombres). 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


233/4839 








Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

5. HOMOMORPHISMES 


Le concept d'homomorphismes (du grec homoios = semblable et morphê = forme) a été défini par les 
mathématiciens car permettant de mettre en évidence des propriétés remarquables des fonctions en 
particulier avec leurs structures, leur noyau, et de ce que nous appelons les "idéaux" (voir plus loin). Ils 
nous permettront ainsi d'identifier une structure algébrique d'une autre. 

Définitions: 

Dl. Si (j 4,*) et (B,°) sont deux magmas (peu importe la notation utilisée pour les lois internes), une 
application/de A dans B est un "homomorphisme de magma" ou "morphisme de magma" (par abus de 
langage nous écrivons parfois juste "homomorphisme") si: 


f{a*b) = f{a)°f{b) Va,beA 


(5.151) 


en d'autres termes, si l'image d'un composé dans A est le composé des images dans B. 

D2. Si et (£?,°) sont deux monoïdes, une application /de A dans B est un "homomorphisme de 
monoïde" si: 


Va,b e A 

/M-h 


(5.152) 


où 1^,1^ sont les éléments neutres respectifs des monoïdes A,B. 

D3. Si A, B sont deux anneaux, un "homomorphisme d'anneaux" (très important pour le chapitre de 
Cryptographie!) de A dans B est une application / : Zl —> B telle que nous ayons pour tout a,a 'e A : 


/(U) = 1, 

f(a+a') = f(a)+f(a') 
f(£ra')=f(a)f(a') 


(5.153) 


où 1^,1^ sont les éléments neutres des anneaux A, B par rapport à la multiplication. 

Soit / : A —> B un homomorphisme d'anneaux. Alors: 

PI. /(0) = 0 

P2. f{~a) = ~f{a) 

P3. Si a est une unité de A, alors f(a) est une unité de B et /(a) -1 = 

Démonstrations: 

DM1. Par / (a + a ) = f(a) + f(a ) , nous avons / (a + 0) = f(a) + /(0). En ajoutant ~f(a) des deux 
côtés de l'égalité, nous obtenons 0 = / (O) 

DM2. La propriété P2 découle aussi de /(a + a') = /(a) + f (a ') et de la propriété PL En effet, nous 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


234/4839 










Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

avons /(O) = f (a + (~a)) = f(à) + f(~a) = 0. En additionnant - fia) aux deux côtés de la dernière 
égalité, nous obtenons / (~a) = ~f(à). 

DM3. Soient a,b e A tels que ctb = ba = 1. Alors par f (a ■ b) = f (a) f (b) et / (l A ) = 1 È , nous avons 
1 = /(l) = J (ab) = f (a) f (b) et de même 1 = f (b) fi a) ce qui montre que f(b) est l'inverse de f{a ) si b 
est l'inverse de a. 


□C.Q.F.D. 

Montrons maintenant qu'un homomorphisme d'anneaux / : A —> B est injectif si et seulement si 
l'élément 0 est la seule pré-image de 0 (et donc réciproquement), ce qui se note techniquement: 

Ker(f) = { 0} (5.154) 


c'est-à-dire que le noyau est trivial. 

Démonstration: 

La condition est clairement nécessaire. Montrons qu'elle est suffisante: 

Nous supposons donc que Ker(f) = 0. Soit a,a 'e A tel que f (a) = fia '). Alors comme nous avons 
un homomorphisme d'anneaux nous pouvons écrire: 

0 = f(a) ~ f(a ) = f(a - a ') (5.155) 

qui implique que a - a ' = 0 donc que a = a' ■ 

Ce qui montre que/ est injectif si c'est un homomorphisme et que et que Ksr( f ) = 0 en est 
effectivement une condition suffisante. 


□C.Q.F.D. 

D4. Soient (A, +) et (5,*) , deux groupes et/une application / : A —> B . Nous disons que/est un 
"homomorphisme de groupe" si (nous pourrions tout aussi bien mettre * au lieu de + dans le premier 
groupe et + au lieu de * dans le deuxième groupe, la définition resterait la même en remplaçant 
simplement les opérateurs respectifs!): 



Vx,.y e A 

f(W=h 


/(x- 1 ) = (/(x))" 1 

Vxei 


(5.156) 


où l^lg sont les éléments neutres respectifs des groupes A,B . Nous remarquons que la seule différence 

entre un homomorphisme d'anneau et un homomorphisme de groupe est que ce dernier à deux lois au 
lieu d'une et que nous y rajoutons le concept d'inverse. 

Ceci dit, la troisième proposition ci-dessus est en fait une conséquence de la définition composée 
uniquement des deux premières lignes. Effectivement, considérons un homomorphisme/entre les 
groupes (A, +) et (B,*) avec \ A et 1 5 respectivement les éléments neutres de A et B. 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


235/4839 







Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

Nous avons alors: 


d'où: 


et donc: 


A: \ B = /(U) = /(* + * ^ ( 5 - 157 ) 

Vx e A \ \ B = /(x)*/(* _1 ) (5.158) 


VxeA:f(x)~ *)) (5.159) 

D5. Soit/une application / : A —> B d'un corps vers un autre. Nous disons que/est un 
"homomorphisme de corps" si/est un homomorphisme d'anneaux... 


Effectivement, le fait que l'homomorphisme de corps soit le même que celui d'un anneau tient juste au 
fait que la différence entre les deux structures est que les éléments du corps sont tous inversibles 
(aucune loi ou propriété de loi ne diffère entre les deux selon leur définition). 


Montrons maintenant que tout homomorphisme de corps est injectif ("homomorphisme injectif') en se 
rappelant que plus haut nous avons démontré que tout homomorphisme d'anneaux l'était! 


Démonstration: 


Si a est différent de 0 et £ = a ~ l (nous utilisons ici la propriété que les éléments d'un corps sont 
inversibles!) alors: 


!=/(!)=/(fl ■*) = /(<*)■/(£) (5.160) 

Donc lorsque a est différent de zéro f(a) est différent de 0 ce qui prouve que Kerif) = {0} et donc que 
/ est injective. 


□C.Q.F.D. 

D6. Soient A et B deux K-ev et / : A —> B une application de A dans B. Nous disons que/est une 
"application linéaire" ou "homomorphisme d'espaces vectoriels" (il est sous-entendu que c'est 
relativement aux lois indiquées et pour l'application choisie) si: 

f{x+y) = f{x) + f(y) V{x,y)eA 
f(Ax) = Af{x) \fxeA,VAe K 

et nous notons L(A,B ) l'ensemble des applications linéaires. 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


236/4839 







Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

Remarques : 

RI. Nous avions déjà défini plus haut le concept d'application linéaire mais n'avions pas précisé que 
les deux ensembles A et B étaient des K-ew. 

R2. L'application linéaire est appelée "forme linéaire" si et seulement si B = K 


D7. Si l'homomorphisme est bijectif nous dirons alors que/est un "isomorphisme". S'il existe un 
isomorphisme entre A et B, nous disons que A et B sont "isomorphes" et nous noterons cela A — B ■ 


Remarque : L'isomorphisme permet au fait d'identifier deux ensembles munis d'une structure 
algébrique identique (que ce soit groupe, anneau, etc.) mais dont les éléments sont nommés d'une 
façon différente. 


D8. Si l'homomorphisme/est une application uniquement interne, nous dirons alors que/est un 
"endomorphisme" (en d'autres termes, nous avons un endomorphisme si dans la définition de 
l'homomorphisme nous avons A=B). 


Remarque : Si nous avons un endomorphisme/de E,f est donc restreint à Im(/). Donc le terme 
"endomorphisme" veut juste dire que l'application/arrive dans E et pas qu'elle touche tous les 
éléments de E. Nous avons / (E) Œ E et pas forcément f(E)=E car dans ce dernier cas nous 
disons que/est surjective comme nous l'avons déjà vu. 


D9. Si l'endomorphisme/ est en plus bijectif (donc en d'autres termes si l'homomorphisme est un 
endomorphisme et un isomorphisme), nous dirons alors que/est un "automorphisme". 

5.1. IDÉAL 

Définition: Soit A un anneau commutatif. Un sous-ensemble S c A est un "idéal" si: 

PL a + a 1 e S pour tout a,a 1 e S 

P2. r ■ a e S pour tout a e S et tout r e A 

En d'autres termes, un idéal est un sous-ensemble fermé pour l'addition et stable pour la multiplication 
par un élément quelconque de A. 

Exemple: 

L'ensemble des nombres pairs est par un exemple d'idéal de l'ensemble des nombres naturels. 
Remarque : Les idéaux S = {0} et S = A sont appelés les "idéaux triviaux". 


Pour savoir si un idéal est égal à tout l'anneau, il est utile d'utiliser la propriété suivante qui spécifie que 
si A est un anneau et I un idéal de A, alors si 1 e / nous avons I = A- 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


237/4839 





























Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

Démonstration: 

Ceci résulte de la propriété P2 de la définition d'un idéal: 

Pour tout r e A, nous avons r = r 'le / car 1 e / • 

□C.Q.F.D. 


Un premier exemple d'idéal est donné par le noyau d'un homomorphisme d'anneaux. Effectivement, 
démontrons que le noyau d'un homomorphisme / : R —> S est un idéal de R. 

Démonstration: 

Soient a,a ' e Ker(f) . Alors: 

f(a+a') = f(a)+f(a') = 0 + 0 = 0 (5.162) 

ce qui montre que a + a ' e Ker(f) . Soit r E R, alors: 

f(™) = f(r)f(a) = f(r)-0 = 0 (5.163) 

ce qui montre que rae Ksr(f). 


□C.Q.F.D. 


Proposition: Soit A un anneau et soit a e A. Le sous-ensemble: 

[ax |xEj4} (5.164) 

noté (a) ou aA, est un idéal (nous allons voir un exemple concret après la prochaine définition). 

Définitions: 

Dl. Un idéal I * A d'un anneau^ est dit "idéal principal" s'il existe a e A tel que 1 = (a). 

D2. Un anneau dont tous les idéaux sont principaux est dit "anneau principal". 

Montrons maintenant que l'anneau Z est principal (car tous ses idéaux sont principaux). 

Démonstration: 

Soit / un idéal de Z (il est facile d'en choisir un: par exemples tous les multiples de 2 ou de 3, etc.). Soit 
r e. 1 le plus petit entier positif non nul de I. Nous allons montrer que / = rZ ■ 

Soit a un élément quelconque de I. La division euclidienne nous permet d'écrire: 

a = qr + r' (5.165) 

avec 0 < r 1 < r (nous l'avons déjà démontré). 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


238/4839 






Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

Mais comme r' = a -qr et que a,r e 1 , par la définition d'un idéal, nous avons r ' e / (la somme ou 
différence des éléments d'un idéal appartenant à l'idéal). Par choix de r (r' étant inférieur à r ) ceci 
implique que r ' = 0 et donc que û = . 

Ainsi tout élément de / est un multiple de r et donc: 

1 =rZ (5.166) 


□C.Q.F.D. 

La démonstration ci-dessus n'utilise que la division euclidienne sur Z ■ Nous pouvons alors généraliser 
ce résultat aux anneaux qui possèdent une division euclidienne. Ainsi, par exemple, l'anneau k[X\ des 
polynômes (cf. chapitre de Calcul Algébrique) à coefficients dans un corps k est un anneau principal 
car il possède une division euclidienne. 

Démonstration: 

Soit / un idéal de k[X\. Notons d le plus petit degré que puisse avoir un polynôme non nul de I. Si d - 0 
alors 1 e l et donc I -1 ■ K{X] - K[X ]. Autrement, soit a(X) un polynôme de degré d. Si u (X) e l 
alors on peut diviser u(X) par a(X). Il existe q(X),r(X) e K{X] tels que deg(r) < deg(a) - de t 
u{X) - q(X") ■ a(X) +r(X) . Donc r (X) e 1 ce qui entraîne r = 0 (autrement contradiction avec la 
minimalité de d). Par suite, u (X) - q (X) ■ a(X). Nous venons de montrer que I - a(X) ■ K[X~\ 

□C.Q.F.D. 

Ainsi, les seuls idéaux de Z sont ceux de la forme mh . De plus si nous avons detm qui sont des 
entiers > 1. Alors mh^dh si et seulement si d \ m. 

Démonstration: 

Si d | m alors il existe n avec m = d • n ■ Soit m a un élément de mh . Alors: 

m ■ a = d ■ n ■ a e dZ (5.167) 


ce qui montre que mZ<zdZ ■ 

Réciproquement, si m e dZ ceci implique que m est de la forme d ■ n et ceci prouve que d divise m. 

□C.Q.F.D. 

Démontrons aussi qu'un anneau R est un corps si et seulement s'il ne possède que les idéaux triviaux 

{0 },R. 

Démonstration: 

Montrons que la condition est nécessaire: Soit / un idéal non nul de R et r e / un élément non nul. Par 
hypothèse (qu'il s'agit d'un corps), il est inversible, c'est-à-dire qu'il existe t e R tel que r t = t ■ r = 1. 
Ceci implique que 1 e / et donc, par un résultat obtenu plus haut / = R. 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


239/4839 






Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

Réciproquement, supposons que tout idéal I * R soit l'idéal nul. Alors si r e R est un élément non nul 
de R, l'idéal principal (r) doit être égal à R. Mais ceci implique que 1 e (r) et donc qu'il existe x e R 
avec r ■ x = 1 ce qui montre que r est inversible. L'anneau R est donc un corps. 


□C.Q.F.D. 

Cette caractérisation va nous permettre de démontrer facilement que tout homomorphisme partant d'un 
corps est injectif. Soit que si f: R—> S est un homomorphisme où R est un corps, alors / est injectif. 

Démonstration: 

Nous mettons ensemble ce qui a été vu jusque-là. Nous avons démontré plus haut que le noyau Ker(f) 
d'un homomorphisme est un idéal. Mais nous avons également démontré plus haut que nous avons soit 
Ker(f) = {0} soit Ker(f) = R (car l'anneau R est un corps si et seulement s'il ne possède que les 
idéaux triviaux). 

Mais vu que /(l) = 1 * 0 (de par la définition d'un homomorphisme) il s'ensuit qu'il reste Ker(J) = {0} 

(puisque nous avons démontré que si A est un anneau et I un idéal de A alors si 1 e 1 alors I = R). Ceci 
implique par un théorème précédent (où nous avons démontré que si Ker(J) = {0} l'homomorphisme 
est injectif) que.../est injective. 


□C.Q.F.D. 


Etudions maintenant les homomorphismes dont l'anneau de départ est Z • Soit A un anneau et 
/ : Z —> A un homomorphisme. Par définition d'un homomorphisme et par ses propriétés, il faut que 
/(O) = 0 et /(l) = 1. Mail il faut encore que: 


/(«) = /(l + l + - 
■._ _ 

v 

H 



= n ■ L 


(5.168) 


pour tout n<=h- Ainsi / est complètement déterminé par la donnée de /( 1) et est donc unique. 
Réciproquement, nous montrons que l'application / : Z —> A définie par: 


/(«)=«■ lj (5.169) 

est un homomorphisme d'anneaux. En résumé, il existe un et un seul homomorphisme de Z dans un 
anneau quelconque A. 

Définition: Soient A un anneau et / : Z —> A l'unique homomorphisme défini précédemment. Si/est 
injectif, nous dirons que A est de "caractéristique nulle". Sinon, Ker(f) est un idéal non trivial de Z et 
comme Z est dès lors principal (comme nous l'avons démontré plus haut) il est de la forme mh avec 
m > 0 . L'entier m est appelé la "caractéristique de A". 


Remarque : Moins formellement, la caractéristique d'un anneau est le plus petit entier positif m tel 
que m ■ 1^ = 0. S'il n'y en a pas, alors la caractéristique est nulle. 


Exemple: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


240/4839 













[SCIENCES.CH] 


L'anneau Z est de caractéristique nulle car l'unique homomorphisme / : Z —> Z est l'identité. Il est 
donc injectif. Les injections Z —» Q, Z —> IR montrent que Q, IR (et (C également) sont des corps de 
caractéristique nulle. 

Nous nous proposons maintenant de démontrer que la caractéristique d'un anneau intègre (et en 
particulier d'un corps) est égale 0 ou à un premier p. 

Démonstration: 

Nous montrons la contraposée. Soit A un anneau de caractéristique m 0 avec m non premier. Il existe 
alors des entiers naturels n,r <,m tels que m = n ■ r . Soit / : Z —> A l'unique homomorphisme (défini 
précédemment). Par définition (de l'idéal) de m, nous avons f{m) = 0 mais f(r) ^ 0 * fin). Mais 
alors f (r)j (n) = f(r ■ n) = f{m) = 0 ce qui montre que A n'est pas intègre. 


□C.Q.F.D. 


Remarque :La réciproque du théorème n'est pas vraie comme le montre l'exemple de l'anneau 
IR x IR où l'addition et la multiplication se font composante par composante. C'est un anneau de 
caractéristique nulle mais avec des diviseurs de zéro: 


(1,0)'(0,1) = 0 (5.170) 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 











Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 



[Vincent ISOZ] | http://www.sciences.ch] | Page: 


242/4839 






















































































Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


243/4839 






















































































Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


244/4839 






















































































Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


245/4839 






















































































Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


6. PROBABILITÉS 


T jq calcul des probabilités s'occupe des phénomènes aléatoires (dits plus esthétiquement: "processus 

stochastiques" lorsqu'ils sont dépendants du temps), c'est-à-dire de phénomènes qui ne mènent pas 
toujours à la même issue et qui peuvent être étudiés grâce aux nombres et à leurs conséquences et 
apparitions. Néanmoins, même si ces phénomènes ont des issues variées, dépendant du hasard, nous 
observons cependant une certaine régularité statistique. 

Définitions: Il existe plusieurs manières de définir une probabilité. Principalement, nous parlons de: 

Dl. "Probabilité expérimentale ou inductive" qui est la probabilité déduite de toute la population 
concernée. 

D2. "Probabilité théorique ou déductive" qui est la probabilité connue grâce à l'étude du phénomène sous- 
jacent sans expérimentation. Il s'agit donc d'une connaissance "a priori" par opposition à la définition 
précédente qui faisait plutôt référence à une notion de probabilité "à posteriori". 

Comme il n'est pas toujours possible de déterminer des probabilités a priori, nous sommes souvent amenés 
à réaliser des expériences. Il faut donc pouvoir passer de la première à la deuxième solution. Ce passage 
est supposé possible en termes de limite (avec une population dont la taille tend vers la taille de la 
population réelle). 

La modélisation formelle par le calcul des probabilités a été inventée par A.N. Kolmogorov dans un livre 
paru en 1933. Cette modélisation est faite à partir de l'espace de probabilités (U, A, P) que nous définirons 
plus loin et que nous pouvons relier à la théorie de la mesure (voir chapitre du même nom). Cependant, les 
probabilités ont été étudiées sur le point de vue scientifique par Fermât et Pascal au milieu du 17ème 
siècle. 


Remarque : Si vous avez un professeur ou un formateur qui ose vous enseigner les statistiques et 
probabilités avec des exemples basés sur des jeux de hasard (cartes, dés, allumette, pile ou face, etc.) 
débarrassez-vous en ou dénoncez-le à qui de droit car cela signifierait qu'il n'a aucune expérience 
pratique du domaine et qu'il va vous enseigner n'importe quoi et n'importe co mm ent (normalement les 
exemples devraient être basés sur l'industrie, l'économie ou la R&D, bref dans des domaines utilisés 
tous les jours par les entreprises mais surtout pas sur des jeux de hasard...!). 


1. UNIVERS DES ÉVÉNEMENTS 


Définitions: 

Dl. "L'univers des événements", ou "univers des observables", U est l'ensemble de toutes les issues 
(résultats) possibles, appelées "événements élémentaires", qui se présentent au cours d'une épreuve 
aléatoire déterminée. L'univers peut être fini (dénombrable) si les événements élémentaires sont en 
nombre fini ou continu (non dénombrable) s'ils sont infinis. 

D2. Un "événement" quelconque A est un ensemble d'événements élémentaires et constitue une partie de 
l'univers des possibles U. Il est possible qu'un événement ne soit constitué que d'un seul événement 
élémentaire. 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


246/4839 










Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

Exemple: 

Considérons l'univers de tous les groupes sanguins possible, alors l'événement A "l'individu est de rhésus 
positif' est représenté par: 


A = | A+, B+, AB-\-,O +] c U (6.1) 

alors que l'événement B "l'individu est donneur universel" est représenté par: 

B = {0-}<zU (6.2) 

qui constitue donc un événement élémentaire. 

D3. Soit U un univers et A un événement, nous disons que l'événement^ "à lieu" (ou "se réalise") si lors 
du déroulement de l'épreuve se présente l'issue i (z e U) et que (i e A ). Dans le cas contraire, nous 
disons que A "n'a pas lieu". 

D4. Le sous-ensemble vide 0 de U s'appelle "événement impossible". En effet, si lors de l'épreuve l'issue 
i se présente, nous avons toujours i £ 0 et l'événement 0 n'a donc jamais lieu. 

Si U est fini, ou infini dénombrable, tout sous-ensemble de U est un événement, ce n'est plus vrai si U est 
non dénombrable (nous verrons dans le chapitre de Statistiques pourquoi). 

D5. L'ensemble U s'appelle aussi "événement certain". En effet, si lors de l'épreuve l'issue i se présente, 
nous avons toujours i e U (car U est l'univers des événements). L'événement U a donc toujours lieu. 

D6. Soit A et B deux sous-ensembles de U. Nous savons que les événements A u B et An B sont tous 
deux des sous-ensembles de U donc des événements qui sont respectivement des "événements conjoints" 
et des "événements disjoints". 

Si deux événements A et B sont tels que: 


AnB = 0 (6.3) 

les deux événements ne peuvent pas être réalisables pendant la même épreuve, nous disons alors qu'ils 
sont des "événements incompatibles". 

Sinon, si: 


An B* 0 (6.4) 

les deux événements peuvent être réalisables dans la même épreuve (possibilité de voir un chat noir au 
moment où on passe sous une échelle par exemple), nous disons inversement qu'ils sont des "événements 
indépendants". 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


247/4839 






Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

1.1. AXIOMATIOUE DE KOLMOGOROV 

La probabilité d'un événement sera en quelque sorte le répondant de la notion de fréquence d'un 
phénomène aléatoire, en d'autres termes, à chaque événement nous allons attacher un nombre réel, 
appartenant à l'intervalle [0,1], qui mesurera sa probabilité (chance) de réalisation. Les propriétés des 
fréquences que nous pouvons mettre en évidence lors d'épreuves diverses nous permettent de fixer les 
propriétés des probabilités. 

Soit U un univers. Nous disons que nous définissons une probabilité sur les événements de U si à tout 
événement A de U nous associons un nombre ou une mesure P(A), appelé "probabilité a priori de 
l'événement A” ou "probabilité marginale de A". 

A1. Pour tout événement A : 


1 > P(A) > 0 


(6.5) 


Ainsi, la probabilité de tout événement est un nombre réel compris entre 0 et 1 inclus (c'est du bon sens 
humain...). 


A2. La probabilité de l'événement certain ou de l'ensemble (somme) des événements possibles est égale à 
1 : 


P(U) = 1 


( 6 . 6 ) 


A3. Si A n B = 0 sont deux événements incompatibles (disjoints), alors: 


P(AuB) = P(Â) + P(B) 


(6.7) 


la probabilité de la réunion ("ou") de deux événements incompatibles (ou mutuellement exclusifs) est 
donc égale à la somme de leurs probabilités (loi d'addition). Nous parlons alors de "probabilité disjointe". 

Exemple: 


Considérons que la probabilité dans une région donnée d'avoir sur 50 ans un tremblement de terre majeur 
est de 5% et que d'avoir sur la même période une inondation majeure est 10%. Nous souhaiterions savoir 
qu'elle est la probabilité qu'une centrale nucléaire rencontre au plus un des deux événements pendant cette 
même période s'ils sont bien incompatibles. Nous avons alors la probabilité qui est la somme des deux 
probabilités ce qui fait 15%... 


Nous retrouverons un exemple de ce genre de probabilité disjointe dans le chapitre de Génie Industriel 
dans la méthode AMDEC (Analyse des Modes de Défaillance, de leurs Effets et de leurs Criticités) pour 
l'analyse de pannes des systèmes à structure complexe. 


Autrement dit sous forme plus générale si (4) ieîr est une suite d'événements disjoints deux à deux (4 et 
4 ne peuvent pas se produire en même temps si i =* j) alors: 



( 6 . 8 ) 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


248/4839 













Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

Nous parlons alors de "o-additivité" car si nous regardons de plus près les trois axiomes ci-dessus la 
mesure P forme une a-algèbre (cf. chapitre de Théorie de la Mesure). 

A l'opposé, si les événements ne sont pas incompatibles (ils peuvent se superposer ou autrement dit: ils ont 
une probabilité jointe), nous avons alors comme probabilité qu'au plus un des deux ait lieu: 

P(AuB) = P(A)+P(B)-P(AnB) (6.9) 

Ceci signifie que la probabilité pour que l'un au plus des événements A ou B se réalise est égale à la 
somme des probabilités pour que se réalise A ou pour que se réalise B, moins la probabilité pour que A et 
B se réalisent simultanément (nous démontrerons plus loin que cela est simplement équivalent à la 
probabilité que les deux n'aient pas lieu en même temps!). 

Exemple: 

Considérons que la probabilité dans une région donnée d'avoir sur 50 ans un tremblement de terre majeur 
est de 5% et que d'avoir sur la même période une inondation majeure est 10% et que ces deux événements 
ne sont incompatibles... Nous souhaiterions savoir qu'elle est la probabilité qu'une centrale nucléaire 
rencontre tout au plus un des deux événements pendant cette même période. Nous avons alors la 
probabilité qui se calcule à partir de la relation précédente et qui donne alors 14.5%... 

Et donc s'ils étaient incompatibles nous aurions A n B = 0 et nous retrouverions alors bien la probabilité 
disjointe: 


P (A u B) = P(A) + P(B) (6.10) 

Une conséquence immédiate des axiomes (A2) et (A3) est la relation entre les probabilités d'un événement 
A et son complémentaire, noté A (ou plus rarement conformément à la notation utilisée dans le chapitre de 
Théorie De La Démonstration le complémentaire peut être noté ->j4): 

P(Â) = 1-P(A) (6.11) 

Soit U un univers comportant un nombre fini n d'issues possibles: 

U = {h>A> (6-12) 

où les événements: 

A = {hj>A = {a} ’-A = {a} (6-13) 

sont appelés "événements élémentaires". Lorsque ces événements ont même probabilité, nous disons 
qu'ils sont "équiprobables". Dans ce cas, il est très facile de calculer leur probabilité. En effet, ces 
événements étant par définition incompatibles entre eux à ce niveau de notre discours, nous avons en vertu 
de l'axiome 3 des probabilités: 

PC/,) +... + P(/_) +P(/„) (6.14) 


mais puisque: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


249/4839 






Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

^ C A U / 3 U... U 4 ) = P(U) = 1 (6.15) 

et que les probabilités du membre de droite sont par hypothèse équiprobables, nous avons: 

p(O-- («.le» 

n 

Définition: Si A et B ne sont pas incompatibles mais qu'ils sont indépendants, nous savons que par leur 
compatibilité A n B 0 , alors (très important en statistiques!): 

P(AnB)=P(A)'P(B) (6.17) 

la probabilité de l'intersection ("et") de deux événements indépendants est égale au produit de leurs 
probabilités (loi de multiplication). Nous parlons alors de "probabilité conjointe" (c'est le cas le plus 
fréquent) ou simplement de "probabilité jointe". 

Exemple: 

Considérons que la probabilité dans une région donnée d'avoir sur 50 ans un tremblement de terre majeur 
est de 5% et que d'avoir sur la même période une inondation majeure est 10%. De plus supposons que ces 
2 événements ne soient pas incompatibles (en d'autres termes ils sont compatibles). Nous allons nous 
intéresser à leur indépendance. Ainsi, nous souhaiterions savoir qu'elle est la probabilité qu'une centrale 
nucléaire rencontre les deux événements en même temps, à quel que moment que ce soit, pendant cette 
même période. Nous avons alors la probabilité qui se calcule à partir de la relation précédente et qui donne 
alors 0.05%... 


Autrement dit sous forme plus générale, les événements A l ,..., A* sont indépendants si la probabilité de 
l'intersection est le produit des probabilités: 



(6.18) 


Remarque : Attention donc à ne pas confondre "indépendants" et "incompatibles"! 


Donc pour résumer jusqu'ici nous avons donc: 


Type 

Expression 

2 événements incompatibles 
(disjoints) 

f(iu5) = P{A) + P(B) 

2 événements incompatibles 
(joints) 

P(iu B) = P (A) + P(B) - P(A n B) 

2 événement non incompatibles 
mais indépendants 

P(A n B) = P( A) • P(B) 


Tableau: 28.1 - Cas classiques de probabilités 


Grâce à la définition précédente, nous pouvons démontrer que la probabilité pour que soit A ou soit B ait 
lieu (donc au moins un des deux mais pas les deux en même temps), est simplement égale à... la 
probabilité que les deux n'aient pas lieu en même temps: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


250/4839 






























Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


P\ Au B i = P(A) + P(B) - P(An B) = 

P(A) + P(B) - P(A)P(B) = 1 - P(Â)P(B) = 1 - (1- P(^))(l - P{B)) 


(6.19) 


Nous pouvons aussi à l'aide de cette dernière définition déterminer la probabilité qu'un seul des deux 
événements ait lieu: 


P{A®B) = P(A)P(B) + P(B)P(A) = P(A)( 1 - P(B)) + P(B)( 1 - P(A)) 
= P{A) + P{B) - 2P(A)P(B) = P(Â) + P(B) - 2 P(An B) 


( 6 . 20 ) 


Exemple: 

Considérons que la probabilité dans une région donnée d'avoir sur 50 ans un tremblement de terre majeur 
est de 5% et que d'avoir sur la même période une inondation majeure est 10%. Nous souhaiterions savoir 
qu'elle est la probabilité qu'une centrale nucléaire rencontre exactement un des deux événements pendant 
la même période en considérant qu'ils ne peuvent avoir lieu en même temps. Nous avons alors la 
probabilité qui se calcule à partir de la relation précédente et qui donne alors 14%... 

Il y a un domaine courant dans l'industrie dans lequel sont appliquées fréquemment les quatre relations 
suivantes (en anglais): 


AND: P(A) P(B) 

OR COMPATIBLE: P(A) + P{B) - P(An B) 

OR INCOMPATIBLE: P (A) +P(B) 

XOR : P(A) + P(B)- 2P(An B) 

Il s'agit de "l'analyse par arbres d'erreurs" ou "analyse par arbres probabilistes" qui est utilisée pour 
analyser les raisons possibles de défaillance d'un système quel qu'il soit (industriel, administratif ou autre). 

Pour clore cette partie du chapitre considérons la figure suivante qui montre les diagrammes de Venn (cf. 
chapitre de Théorie Des Ensembles) pour les 16 événements (y compris l'événement impossible) qui 
peuvent être décrits en termes de deux événements donnés A et B. Dans chaque cas, l'événement est 
représenté par la zone rouge: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


251/4839 








Figure: 6.1 - Diagrammes de Venn possibles pour deux événements 


Considérons la situation où A représente un tremblement de terre et B représente une inondation majeure 
et U l'univers de tous les événements dramatiques pour une centrale nucléaire. Nous considérons que les 
deux événements sont indépendants. Ensuite, chacune des 16 combinaisons d'événements peuvent être 
décrites comme suit, soit mathématiquement ou verbalement. 

1. Un tremblement de terre peut se produire ou une inondation ou rien ou l'ensemble à la fois ou tout autre 
événement (bref n'importe quel événement peut se produire). 


P \ZJ\ =1 = 100% (6.22) 

2. Au B : Tout événement incluant un tremblement de terre, une inondation ou les deux en même temps 
peut se produire. 


P* Au B ' = P* A'+P* B P* Ar\ B ' = P* A'+P* B \ - P* A'P' B * (6.23) 

3. Au B c : Tout événement incluant un tremblement de terre avec ou sans une inondation peut se 
produire à l'exception des événements incluant une inondation sans tremblement de terre. 

P\AuB c 1= Pi U)-P\.Bi + PiAnBi = l-PiBi+Pi A>P<B> (6-24) 

4. A c u B ■ Tout événement incluant une inondation avec ou sans tremblement de terre peut se produire à 
l'exception des événements incluant un tremblement de terre sans inondation. 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


252/4839 





















Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


Pi A c uPl = P« U>-P>A< + P< AnB> = \-P< A<+P> A>P<B> ( 6 - 25 ) 


5. A c u B c : Tout événement peut se produire sauf ceux incluant un tremblement de terre accompagné 
d'une inondation. 


P'A C kjB c ]= P[U\-P\AnB) = \-P[A\P[B) (6.26) 

6. A: Tout événement avec un tremblement de terre peut se produire (cela inclut donc les événements 
associant un tremblement de terre et une inondation). 


Pi A\ = Pi Ai (6.27) 

7. B: Tout événement avec une inondation peut se produire (cela inclut donc les événements associant une 
inondation et un tremblement de terre). 


P[B)=P[B'\ (6.28) 

8. 1 A n B ■ u i A c n B c \ : Tout événement peut se produire sauf ceux incluant un tremblement de terre 
sans inondation ou ceux incluant une inondation sans tremblement de terre. 


P\[An B'\kj\A c kj B c \\= P[U\-P[A\-P[B'\ + 2P[An B'\ 
= P\ A\- P\ B'\ + 2P\ A'\P\ B\ 


(6.29) 


9. I An B c i u i A c u B i : Tout événement incluant un tremblement de terre sans inondation ou une 
inondation sans tremblement de terre peut avoir lieu. 

P\ i An B c ju [ A c u B j j = Pi A\ + Pi B 1-2 Pi An B i (6.30) 

10. B c : Tout événement excepté ceux associés à une inondation peuvent avoir lieu. 

P\B C i = P>U<-P<B> = \-P<B> (6.31) 

11. A c : Tout événement excepté ceux associés à un tremblement de terre peuvent avoir lieu. 


Pi A c 1 = P.t/|-P. A< =\-P>A< (6.32) 

12. An B ■ Tout événement associant un tremblement de terre et une inondation peut avoir lieu. 

P' An B'\ = P[A'\P\B'\ (6.33) 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


253/4839 







[SCIENCES.CH] 


13. An B c '■ Tout événement avec un tremblement de terre sans inondation peut avoir lieu. 

P' AnB c i= P‘A<-P< A\P\B\ (6-34) 

14. A c n B'■ Tout événement avec une inondation sans tremblement de terre peut avoir lieu. 

Pi A c nP' = PyB\-P[A\P[B\ (6-35) 

15. A c nB c '■ Tout événement peut avoir lieu excepté ceux incluant un tremblement de terre et/ou une 
inondation. 


Pi A c nB c 1 = P[U\-P\ AuB< = l-P>Ai-P>B>+P<A>P<B> (6.36) 


16. An A c ou B n B c : Événement impossible. 

P\AnA c i= P\BnB c i = P.0. = 0 (6-37) 

1.2. PROBABILITÉS CONDITIONNELLES 

Que pouvons-nous déduire sur la probabilité d'un évènement B sachant qu'un évènement A est réalisé 
sachant qu'il existe une lien entre A et B1 En d'autres termes, s'il existe bien un lien entre A et B, la 
réalisation de A va modifier notre connaissance sur B et nous voulons savoir s'il est possible de définir la 
probabilité d'un événement conditionnellement (relativement) à un autre événement. 

Ce type de probabilité est appelée "probabilité conditionnelle" ou "probabilité à posteriori" de B sachant 
A, et se note dans le cadre de l'étude des probabilités conditionnelles: 

P[B/A) (6.38) 

et souvent dans la pratique pour éviter la confusion avec une possible division: 

P>B\A> (6.39) 

et nous trouvons parfois chez les américains la notation: 

P(B A A) (6.40) 

Nous avons aussi le cas: 


P>A\B) (6.41) 


qui est appelé "fonction de vraisemblance de A " ou encore "probabilité a priori de A" sachant B. 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 








Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

Historiquement, le premier mathématicien à avoir utilisé correctement la notion de probabilité 
conditio nn elle fut Thomas Bayes (1702-1761). Aussi parlons-nous souvent de Bayes ou de bayésien dès 
que des probabilités conditionnelles sont enjeu: formule de Bayes, statistique bayésienne... 

La notion de probabilité conditionnelle que nous allons introduire est beaucoup moins simple qu'elle ne 
paraît a priori et les problèmes de conditionnement sont une source inépuisable d'erreurs en tout genre (il 
existe de fameux paradoxes sur le sujet). 

Commençons d'abord par un exemple simpliste: Supposons que nous ayons deux dés. Imaginons 
maintenant que nous ayons lancé seulement le premier dé. Nous voulons savoir quelle est la probabilité 
qu'en lançant le second dé, la somme des deux chiffres vaille une certaine valeur minimale. Ainsi, la 
probabilité d'obtenir cette valeur minimale fixée sachant la valeur du premier dé est totalement différente 
de la probabilité d'obtenir cette même valeur minimale en lançant les deux dés en même temps. Comment 
calculer cette nouvelle probabilité? 

Formalisons la démarche: 

Après le lancer du premier dé, nous avons: 

A - \ 1 e résultat du premi er lancé est..} (6.42) 

Soit l'hypothèse que B c A, nous pressentons que P(B IA) doit être proportionnel à P(B), la constante de 
proportionnalité étant déterminée par la normalisation: 

P(A/A) = 1 (6.43) 

Soit maintenant B <zA c (B est inclus dans le complémentaire de A donc les événements sont 
incompatibles). Il est relativement intuitif.... que sous hypothèse précédente d'incompatibilité nous ayons 
la probabilité conditionnelle: 


P(B/A)= 0 (6.44) 

Ceci nous mène aux définitions suivantes des probabilités à posteriori et respectivement à priori: 


P(BIA) 

et 

P(AIB)- P{AnB) 

P(A) 


P{B) 


Ainsi, le fait de savoir que A est réalisé réduit l'ensemble des résultats possibles de U de B. A partir de là, 
seules les éventualités d e An B ont une importance. La probabilité de A sachant B inversement (par 
symétrie) doit donc être proportionnelle à P(A n B) ! 

Le coefficient de proportionnalité qui est le dénominateur permet d'assurer l'événement certain. 
Effectivement, si les deux événements A et B sont indépendants (pensez à l'histoire du chat noir et de 
l'échelle par exemple), nous avons donc: 

P(AnB)=P(A)-P(B) (6.46) 

et nous voyons alors P(B IA) qui vaut P(B) et donc A n'apporte rien sur B et réciproquement! ! Donc en 
d'autres termes, si A et B sont indépendants nous avons: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


255/4839 










Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

P{B!A) = P{B) et P(A!B) = P(A) (6.47) 

Une autre façon assez intuitive pour voir les choses est de se représenter la mesure de probabilité P 
comme une mesure d'aires de sous-ensembles de M 2 - 

En effet, si A et B sont deux sous-ensembles de M 2 d'aires respectives P(A) et P(B) alors à la question de 
savoir qu'elle est la probabilité qu'un point du plan appartienne à B sachant qu'il appartient à A il est assez 
évident de répondre que cette probabilité est donnée par: 

Surface(A) C\Surface\B) 

- (6.48) 

Surface (j4) 

Indiquons aussi que la définition des probabilités conditionnelles s'utilise souvent sous la forme suivante: 

P(A n B) = P(A! B) ■ P(B) = P(B/A)P(A) (6 .49) 

appelée "formule des probabilités composées". Ainsi, la probabilité à posteriori de B sachant^ peut donc 
aussi s'écrire sous la forme: 


P(BfA) = 


P(AfB)P(B) 

P(Â) 


(6.50) 


Exemple: 

Supposons une maladie comme la méningite. La probabilité de l'avoir sera notée P(M) = 0.001 (chiffre 
arbitraire pour l'exemple) et un signe de cette maladie comme le mal de tête sera noté P(S) =0.1. 
Supposons connue la probabilité à posteriori d'avoir mal à la tête si nous avons une méningite: 

P{SiM) = 0.9 (6.51) 

Le théorème de Bayes donne alors la probabilité a priori d'avoir une méningite si nous avons mal à la 
tête!: 


£t™W =0 .009 (652) 

P(S) 

Pour en revenir à la théorie, notons que nous avons aussi: 

P(A)= P{{B l uB 2 u...uB i )nA) = P{{B l r*A)v{B 2 nA)u...Kj{B»nA)) 

= P{B X nA)+P{B 2 nA)+...+P{B n nA) 

= P(A / B 1 )P(B 1 ) + P(Ai B 2 )P(B 2 )+... + P(A / B„)P(B„ ) (6.53) 

^PiAlB^PiB,) 

i =1 

Nous pouvons donc connaître la probabilité de l'événement^ connaissant les probabilités P(Bj) 
élémentaires de ses causes et les probabilités conditionnelles de A pour chaque B l : 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


256/4839 










Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


p(A)^ZP( AfB i') p{ A) 

2=1 


(6.54) 


qui est appelée la "formule des probabilités totales" ou "théorème des probabilités totales". Mais aussi, 
pour tout j, nous avons le corollaire suivant en utilisant les résultats précédents qui nous donne suite à un 

événement^, la probabilité que ce soit la cause B l qui l'ai produit: 


P(B j SA) = 


PiBj-nA) 

P(Â) 


P{AS Bj)P(Bj) 


(6.55) 


qui est la forme générale de la "formule de Bayes" ou "théorème de Bayes" que nous utiliserons un tout 
petit peu en Mécanique Statistique et dans le cadre de l'étude de la théorie des files d'attentes (cf. chapitre 
de Techniques De Gestion). Il faut savoir que les implications de ce théorème sont cependant 
considérables dans le quotidien, dans la médecine, dans l'industrie et dans le domaine du Data Mining 
informatique. 


Nous retrouvons souvent dans la littérature de nombreux exemples d'applications de la relation précédente 
avec uniquement deux issues possibles B relativement à l'événement A. Dès lors nous avons la formule de 
Bayes écrite sous la forme suivante pour chacune des issues: 


P(B l IA) = 


P(B 2 S A) = 


P{A! B l )P(B 1 ) 


Pi.ASBi)P{B 1 i 


P{A!B{)P{B{)+P{AfB 2 )P{B 2 ) P{A!B l \P{B l i + P\ASB x \P\B X i 


P(ASB 2 )P(B 2 ) 


Pi A f B 2 )P[B 2 ) 


(6.56) 


P(Af B X )P(B X ) + P(Af B 2 )P(B 2 ) P\ASB 2 )P[B 2 ) + P[A/B 2 >P>B 2 


et remarquons que dans ce cas particulier (des issues binaires): 

P(B X SA) + P(B 2 f A) = Pi B l f Ai + P\B^f A\ 

P' A S B^ ' P' B^ 1 P' A! B 2 1 P 1 B 2 1 

P ' A ! B^ ' P ' B^ ) + P I A S B^ i Pi B^ i P' AS B 2 i P i B 2 I + P i A S B 2 < P ' B 2 i 

P< Ai B\ <P> B[ * P> AS B 2 <P* B 2 i (6.57) 

Pi AS B\ iPi Bi i +PiASBi \P\Bi \ Pi A l > P> Bi > + P\A S Bi i P\ Bi \ 

_ PiA/Bi\PiBi)+PiASB 2 \PyB 2 i _ P\AS By iP[B x i +P\ A! Bi \P\Bi ) 

P< AS Bl \Pi Bl ! + P\AiTi\P\l\\ PiA!Bi\P[Bi-\ + P\Ail\\P\B'i\ 

ce qui est un résultat intuitif. 

Pour les événements binaires, nous avons aussi (en revenant au théorème des probabilités totales vu plus 
haut): 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


257/4839 




















Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


2 

P{A) = ^P\Ai B t \P> Bj \ = P[Af >P‘B l < + P<A!B 2 <P>B 2 i 

M (6.58) 

= P> Al 'P' i?! ) + P( Al B\ \P\B^ i 


Exemples: 

El.Une maladie affecte 10 personnes sur ÎO'OOO (soit 0.1% = 0.001). Un test a été développé qui a 5% de 
faux positifs (personnes non atteint pour lequel le test dit qu'ils sont atteintes) mais qui détecte toujours 
cette maladie si une personne est atteinte. Quelle est la probabilité qu'une personne aléatoire pour laquelle 
le test donne un résultat positif a vraiment cette maladie? 


Il y a donc sur ÎO'OOO personnes, 500 qui seront des faux positifs et nous savons a posteriori que 10 
personnes ont réellement la maladie. Alors la probabilité que quelqu'un qui a un résultat de test positif soit 
vraiment malade est: 


P' M ' = 0.001 
FiÂfi = 0.999 
P[T ! M\ = \ 

P\T i M \ = 0.05 

P<T< = P'T!M'P'M< + P\TIM\P\M 

P\TIM\P\ M\ 1-0 001 

P< MIT> = -= = 

F. 7- 0.05095 


i = 0.05095 
0.19627 


(6.59) 


Ce résultat est souvent contre-intuitif et même scandaleux. Il met aussi en évidence pourquoi les tests de 
diagnostiques doivent être extrêmement fiables! 


E2. Deux machines M Y et M 2 produisent respectivement 100 et 200 pièces. M 1 produit 5% de pièces 
défectueuses et M 2 en produit 6% (probabilités a posteriori). Quelle est la probabilité a priori pour qu'un 
objet défectueux ait été fabriqué par la machine M l ? 


L'événement constaté A est donc la présence d'une pièce défectueuse et la probabilité recherchée est la 
probabilité a priori que celle-ci provienne de la machine iWj . 

Nous avons alors: 


plu P { AIU i) P { M t) PjAli^P^) 

^ J ' * ^ j P{ASM i )P{M i ) P{AIM l )P{M l ) + P{AI M 2 )P{M 2 ) 

i 

5 100 1 (6-60) 

ÏÔÔ 3ÔÔ 0 3 „ n ,o 

- A 100 +A 200 - 5% l +6% 2- ' 

100 300 100 300 3 3 

E3. D'un lot de 10 pièces dont le 30% est défectueux, nous prélevons sans remise un échantillon de taille 
3. Quelle est la probabilité que la seconde pièce soit bonne (quelle que soit la première)? 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


258/4839 
















Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

Nous avons: 


= f I P(AIB t )P(B i ) = £ P( AIB <) p (. B i ) 
w l " 1 (6.61) 

= P(AIB l )P(B l )+P(AIB 2 )P(B 2 ) = ~ + ~=lV>/<, 

où P{A/ B{) est la probabilité que la deuxième soit bonne sachant que la première est mauvaise et 
P [A! B 2 ) est la probabilité que la deuxième soit bonne sachant que la première est bonne. P(B l ) est 
donc la probabilité que la première soit mauvaise, P(B 2 ) la probabilité que la première soit bonne. 

E4. Terminons avec un exemple important dans les entreprises où les employés doivent plusieurs fois dans 
leur carrière passer des examens sous forme de questionnaire à choix multiples (Q.C.M.). Si un employé 
répond à une question de deux choses l'une: soit il connaît la réponse, soit il la devine. Soit p la probabilité 
que l'employé connaisse la réponse et donc 1 -p celle qu'il la devine. Nous admettons que l'employé qui 
devine répondra correctement avec une probabilité l/m où m est le nombre de réponses proposées. Quelle 
est alors la probabilité a priori qu'un employé connaisse (réellement) la réponse à une question à 5 choix 
s'il y a répondu correctement? 

Soient B et A respectivement les événements "l'employé connaît la réponse" et "l'employé répond 
correctement à la question". Alors la probabilité à priori qu'un employé connaisse (réellement) la réponse 
à une question qu'il a répondu correctement est: 


P(B/A) = 


P(A/B)P{B) 

P(Ai B) P {B) + P {Ai B')P(B') 


1 P 


l - p + —{\-p\ 

m 


- = 83% 
6 


(6.62) 


L'analyse bayésienne fournit donc un outil puissant de formalisation du raisonnement dans l'incertain et 
les exemples que nous avons montrés illustrent surtout à quel point cet outil est délicat à employer. 

1.2.1. ESPÉRANCE CONDITIONNELLE 

Maintenant, passons à la version continue de la probabilité conditionnelle en abordant le sujet directement 
avec un exemple particulier (la théorie avec le cas général étant indigeste) infiniment important dans le 
domaine de statistiques sociales et de la finance quantitative. Cependant, ce choix (de l'étude d'un cas 
particulier) implique que le lecteur ait lu au préalable le chapitre de Statistiques pour y étudier les 
fonctions de distributions continues et plus particulièrement celle de la loi de Pareto. 

Donc voilà le scénario: Souvent, en sciences sociales ou en économie, nous trouvons dans la littérature 
spécialisée traitant des lois de Pareto des affirmations du type suivant (mais quasiment jamais avec une 
démonstration détaillée): quel que soit votre revenu, le revenu moyen de ceux qui ont un revenu supérieur 
au vôtre est dans un rapport constant, supérieur à 1, à votre revenu si celui-ci suit une variable aléatoire de 
type Pareto. Nous disons alors que la loi est isomorphe à toute partie tronquée elle-même. 

Voyons de quoi il s'agit exactement: 

Soit X une variable aléatoire égale au revenu et suivant une loi de Pareto de densité (cf. chapitre de 
Statistiques): 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


259/4839 








Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


/(*) = * 



(6.63) 


avec k >\,x m > 0, x > x m et qui a pour fonction de répartition (voir aussi le chapitre de Statistique pour la 
démonstration détaillée): 


P{X< x) = l- 


. 


\* 


771 

* J 


(6.64) 


La phrase commence par "quel que soit votre revenu...", choisissons donc un revenu quelconque 

À présent nous devons calculer "le revenu moyen de ceux qui ont un revenu supérieur à x 0 ". Il s'agit donc 
de calculer l'espérance (le revenu moyen) d'une nouvelle variable aléatoire Y qui est égale à X mais 
restreinte à la population des personnes ayant un revenu supérieur à xq : 


Y=X \{X>x} (6.65) 

La fonction de répartition de Y est donnée par: 


P'Y<X' = P'X<x\X>Xq' ( 6 . 66 ) 


Cette expression est naturellement nulle si x < x 0 . 


Bon, jusqu'à maintenant nous n'avons fait que du vocabulaire. D'abord rappelons la relation de probabilité 
conditionnelle suivante vue plus haut: 


P{B! A) = 


P(AnB) 

P(Â) 


(6.67) 


pour x > xq nous avons la loi conditionnelle à priori: 


P< X < xf X> x g ' = 


P<x Q <X <x i 
P 1 X A xq 1 


( 6 . 68 ) 


Avant d'aller plus loin, il faut être conscient que le numérateur et dénominateur sont indépendants mais 
que l'ensemble doit être toutefois considéré comme la réalisation d'une seule et unique variable aléatoire 
que nous noterons Y. Par ailleurs, seulement le numérateur est dépendant d'une variable. Le dénominateur 
peut lui être considéré comme une constante de normalisation. 


Nous voyons donc que la densité de Y est donnée par la fonction: 


/rO) = 


0 

/O) 


PI X > Xq 


7 <*0 
7^*0 


(6.69) 


À présent nous pouvons calculer l'espérance de Y: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


260/4839 














Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


+00 j- 

£(?") = | yfj(y)dy = | j „ T , 7 —üfy = 

J 


1 


-H» 


P' JfT > Xg 1 P' X > 7g i L 


v/i y \dy 


1 


-K» 


yk^rdy = 


p< x > x Q ■ ■ ' y* 


i +» * ■+“ i 

‘ *+»= „■£: 4» («O» 

F'A>Xg'- _y* f' Xg ■ ■ _/ 


Sachant que: 


m 

1 

P ' X > Xg 

'(fc-l)/- 1 


P< X> X g 


+O0 


1 




m 


P* X>x g 1 (A: -1)Xg 


fc-1 


+°o k Je 

i x„ 


fin 
*o ; 


(6.71) 


Nous avons au final: 


E(Y)=-P-^ 

'K — 1 1 


(6.72) 


E( Y) représente donc le revenu moyen de ceux qui ont un revenu supérieur à xg et comme on peut le 
constater de l'égalité ci-dessus il est bien dans un rapport constant, supérieur à 1, à votre revenu x 0 . 

Nous pouvons vérifier ce résultat en faisant une simulation de Monte-Carlo dans un tableur (c'est 
intéressant de le mentionner pour généraliser à des cas non calculable à la main). Il suffit effectivement 
d'y simuler l'inverse de la fonction de répartition: 


X = 



-Alh 


{\-P(X<x)j 


(6.73) 


soit dans MS Excel 11.8346 (version anglaise): 

=($B$7 A $B$6/(1-RANDBETWEEN(1;10000)/10000)) A (1/$B$6) 

et ensuite de prendre la moyenne des valeurs obtenues supérieurs ou égales à un X donné (ce qui 
correspondra à x 0 ) et vérifier que nous obtenons bien le résultat démontré précédemment! 

Évidemment, nous pourrions aussi calculer la variance conditionnelle (in extenso l'écart-type 
conditionnel). Cela viendra peut-être un jour... 

1.2.2. RÉSEAUX BAYÉSIENS 

Les réseaux bayésiens sont simplement une représentation graphique d'un problème de probabilités 
conditionnelles qui permet de mieux visualiser l'interaction entre les différentes variables lorsque que 
celles-ci commencent à être en grande nombre. 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


261/4839 





















Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

C'est une technique de plus en plus utilisée dans le décisionnel assisté par logiciel (Data Mining), 
l'intelligence artificielle (AI) et également dans l'analyse et la gestion du risque (norme ISO 31010). 

Les réseaux bayésiens sont par définition sont des graphes orientés acycliques (cf. chapitre de Théorie Des 
Graphes), afin qu'un événement ne puisse pas (même indirectement) influencer sa propre probabilité, avec 
description quantitative des dépendances entre événements. 

Ces graphes servent à la fois de modèles de représentation des connaissances et de machines à calculer des 
probabilités conditionnelles. Ils sont surtout utilisés pour le diagnostic (médical et industriel), l'analyse de 
risques (diagnostics de pannes, anomalies ou accidents), la détection des spams, l'analyse de texte de voix 
et d'images, l'analyse d'opinions, la détection de fraudeurs ou de mauvais payeurs ainsi que dans le data 
mining (EGC: Extraction et Gestion de la Connaissance) en général. 


Remarque : De nombreux systèmes et logiciels permettent de construire et d'analyser des réseaux 
bayésiens sur la base de dessins ou de d'informations existantes dans des bases de données. Solutions 
payantes: SQL Server, Oracle, Hugin. Solutions gratuits (à ce jour): Tanagra, Microsoft Belief 
Network MSBNX 1.4.2, RapidMiner. Personnellement je préfère la simplicité du petit logiciel 
MSBNX de Microsoft. Pour information, en 10 ans d'expérience professionnelle en tant que consultant 
je n'ai rencontré à ce jour qu'une seule entreprise parmi plus de 800 multinationales dans mon 
portefeuille qui utilisait les réseaux de bayésiens... (dans le domaine des transports). 


Utiliser un réseau bayésien s'appelle faire de "l'inférence bayésienne". En fonction des informations 
observées, nous calculons la probabilité des données possibles connues mais non observées. 

Pour un domaine donné (par exemple médical), nous décrivons les relations causales entre variables 
d'intérêt par un graphe (plus besoin de préciser qu'il est acyclique). Dans ce graphe, les relations de cause 
à effet entre les variables ne sont pas déterministes, mais probabilisées. Ainsi, l'observation d'une cause ou 
de plusieurs causes n'entraîne pas systématiquement l'effet ou les effets qui en dépendent, mais modifie 
seulement la probabilité de les observer. 

L'intérêt particulier des réseaux bayésiens est de tenir compte simultanément de connaissances a priori 
d'experts (dans le graphe) et de l'expérience contenue dans les données. 

Exemple de 5 variables avec relations (graphe orienté acyclique) et numérotation des états/variables (en 
anglais: "states"): 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


262/4839 










Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 



Figure: 6.2 - Exemple de réseau bayésien (acyclique orienté) à 5 états 


Évidemment, la construction du graphe causal se fonde principalement sur le retour d'expériences (REX) 
et résulte parfois de normes ou de rapports de comités d'experts. Dans l'informatique, le graphe causal 
évolue automatiquement en fonction des bases de données (pensez à la librairie Amazon qui cible les 
publicités en fonction de vos achats passés en temps réel ou au service Genius de Apple). Cependant nous 
pourrons rarement penser à toutes les possibilités et il y aura aussi parfois des états cachés entre deux états 
qui auront été oubliés mais qui auraient permis de mieux modéliser la situation. 

Imaginons dans l'exemple ci-dessus qu'à l'aide d'une base de données d'une entreprise, nous sachions que 
sur ÎOO'OOO jours hommes, nous avons eu dans cette entreprise l'OOO accidents du travail (soit 1% du 
total) et 100 pannes machines (soit 0.01% du total). Nous représentons cela alors sous la forme 
traditionnelle suivante: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


263/4839 









Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


P{51 H l%,99%] P(S2)=[Û. l%,99.9%] 



où nous avons le sous-ensemble 52,54, 55 qui constitue ce que les spécialistes appellent une "connexion 
série ou linéaire", le triplet 53, 52, 54 constitue une "relation divergente" (si les flèches pour ce triplet 
étaient inversées, nous aurions une "relation convergente"). 

Avant d'aller plus loin avec notre exemple faisons quelques constats par rapport à ces trois types de 
relations: 

Pour toute clarté, distinguons d'abord "l'indépendance conditionnelle" de la "dépendance conditionnelle". 

Nous disons que des événements A et C sont "indépendants conditionnellement" si étant donné un 
événement B l'égalité suivante est vérifiée: 

P< AI B < = P< AlB,C< (6.74) 

Donc le qualificatif "conditionnellement" implique la présence de B et le fait que C n'influence pas la 
probabilité de l'événement A. 

Concernant la "dépendance conditionnelle", nous pouvons cette fois distinguer 3 types de relations. 

1. La dépendance conditionnelle du type suivant est appelée "connexion série ou linéaire" (déjà 
mentionnée plus haut): 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


264/4839 










Figure: 6.4 - Réseau bayésien en connexion série/linéaire 


où A, B et C sont dépendants (dans cet exemple particulier il y a 3 nœuds dépendants A, B et C mais d'une 
manière générale cette dépendance concernerait tous les noeuds s'il y en avait plus de 3). 


En outre A et C sont dépendants mais conditionnellement à B. Mais si la variable B est connue, A 
n'apporte plus aucune information utile sur C (le cheminement de l'incertitude est en quelque sorte rompu) 
et dès lors A et C deviennent indépendants conditionnellement. Nous avons la probabilité conditionnelle 
qui se simplifierait donc sous la forme suivante: 


PiCfB,A\ = P[CtB\ (6.75) 

2. La dépendance conditionnelle du type suivant est appelée "connexion divergente" (aussi déjà 
mentionnée plus haut): 



où l'ensemble des nœuds sont dépendants. 

En outre B et C sont dépendants conditionnellement à A. Mais si A est connue, B n'apporte plus aucune 
information sur C (à nouveau le cheminement de l'incertitude est en quelque sorte rompu) et dès lors B et 
C deviennent indépendants. Nous avons donc par exemple si A est connue: 

PiCtA,B\ = PiCfA) (6.76) 

3. La dépendance conditionnelle du type suivant est appelée "connexion convergente" ou "V- 
Structure" (aussi déjà mentionnée plus haut): 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


265/4839 

















Figure: 6.6 - Réseau bayésien convergent 


où cette fois les parents sont indépendants. 

Donc B et C sont indépendants mais deviennent dépendants conditionnellement à A. Si A est connue, nous 
avons alors: 


P\Al B,C\ = P\AIB\ (6.77) 

La dépendance entre les parents passe donc par l'observation de leur enfant commun. 

Maintenant, pour faire un exemple concret, imaginons que notre base de données nous donne (grâce aux 
responsables qualité qui ont toujours su saisir les anomalies qualité) que lorsqu'une panne machine a eu 
lieu, 99 fois sur 100 (99%) il y a eu un arrêt total de la production (donc in extenso 1 fois sur 100: 1% il 
n'y pas eu d'arrêt de la production) et que sur tous les arrêts de la production 1% n'était pas dû à une panne 
machine. Ce que nous représentons traditionnellement sous la forme suivante: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


266/4839 







Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


P(SI )=[! P(i’2K«. 1%,99.9%] 



P<S4<=P‘S4fS2>P<S2< + P\S4fS2\P\S2\ = 99%Q. 1% +1% ■ 99.9% = 1.098% (6.78) 

Ce chiffre représente donc la proportion implicite d'arrêts de production parmi les ÎOO'OOO jours hommes 
(nous pouvons donc donner une proportion de lignes de la base données représentant un arrêt production 
quelle que soit la cause et ce sans même avoir les détails de la base de données). 

Il en découle immédiatement alors la probabilité implicite qu'il n'y ait pas d'arrêt de la production: 

Pi£4i= 1-F.S4. = 98.902% (6.19) 

Ce qui est conforme à ce que nous donne le logiciel gratuit MSBNX 1.4.2: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


267/4839 
















Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 



Figure: 6.8 - Début du réseau bayésien dans MSBNX 1.4.2 

Maintenant supposons que nous avons observé un arrêt de la production. Quelle est la probabilité à 
posteriori qu'il soit dû à une panne machine? Nous avons alors: 


P>S2/S4>= 


PiS4f S2iP[S2) 
P.S 4- 


99% 0.1% 
1.098% 


9.02% (6.80) 


Ce que nous pouvons aussi vérifier avec le logiciel MSBNX 1.4.2: 


Pi. Microsoft Bel'ef Networks: Eva uating 'Model' - [Evaluation: 


D 

1^ 

| [É*| E 1 

1 

H 

1 * »1 


B.» File View Wintlow Help 


rretProduction = Ye 


El* 

PanneMachine 


Spreadsheet | Bar Chart | Recommendations | 


Node Name 

State 0 

State 1 

ÀrretProduction 

Yes 

No 


1.0000 

0.0000 

Panne machine 

Yes 

No 


0.0902 

0.9099 




Figure: 6.9 - Probabilité a posteriori d’un arrêt dû à une panne machine dans MSBNX 1.4.2 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


268/4839 




































































Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

Maintenant, imaginons que notre base de données nous donne (toujours grâce aux responsables qualité qui 
ont veillé à saisir les anomalies qualité) que 99 fois sur 100 (99%) lorsqu'il y a eu un arrêt de la 
production, il y a eu une évacuation. En revanche 5 % des évacuations ont été identifiées comme n'ayant 
rien à voir avec un arrêt de la production (donc 95% des évacuations sont dues à des exercices incendie 
OU à d'autres événements): 


P(S1 )=[ 1 P(À7H0.1 %,99.9%] 



Maintenant, pour calculer la probabilité implicite des évacuations a posteriori par rapport aux pannes 
machines, nous avons vu que lorsque nous avions une dépendance conditionnelle série, la probabilité 
conditionnelle ne dépendait que du parent direct. Ainsi, il vient: 

P[S5) = Pi S5f S4 i Pi £4 i + P\S5f S4 iP(£4i = 99% 1.098% + 5% -98.902% = 6.03% (6.81) 

Ce qui peut se vérifier avec le logiciel MSBNX 1.4.2: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


269/4839 





















Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


Ti Mc'ojc+t e( Nctwciki: :0 ting ' l .l5* - [2«i c x \riv.o-. Model] 
Filt Vitw ^Virufow Hflp 

Çl»! fflrlVsl^l lJ” 


PanneMachine 
(Parme fléchi ne) 



I iï.999 


V 


ArretPnod üctioh 


(Arre 


:tPrMy< 



etiort) 


I b 



(Evacuation) 


Figure: 6.11 - Probabilité implicite d’une évacuation dans MSBNX 1.4.2 

Donc la probabilité implicite de l'évacuation ne dépend effectivement pas des pannes de machines. 

Maintenant supposons que nous avons observé une évacuation. Nous voulons savoir quelle est la 
probabilité a posteriori qu'elle soit due à une panne machine! Nous avons alors: 


PiS5fS4\PiS4\ 99% 1.098% 

P\S4tS5i = --=- -- = 18.02% (6.82) 


P>S5> 


6.03% 


Ce que nous pouvons aussi vérifier avec le logiciel MSBNX 1.4.2: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


270/4839 























Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 



Figure: 6.12 - Probabilité a posteriori d'une évacuation due à une panne machine dans MSBNX 1.4.2 

Maintenant nous étudions le cas avec l'alarme et là aussi une base de données nous permet de construire 
un tableau avec les différentes probabilités: 




TWHO. l%,99.9%] 



Figure: 6.13 - Réseau bayésien de deuxième niveau avec seconde branche 


Maintenant, pour calculer la probabilité implicite qu'il y ait une alarme, il va falloir considérer les quatre 
situations possibles. Nous avons alors en utilisant le théorème des probabilités totales: 


P[S3\ = P[S3f SlS2\P[ShP[S2\+P\ S3fS\,S2)PiSl\PiS2) 

' _. ' _ ' . ' __, ' (6.83) 

+P[S3!SlS2\P\SbP\S2\ + P\S3t SIS2)P\S1\P[S2\ 


Ce qui un peu plus rigoureusement devrait s'écrire: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


271/4839 








































































Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


P, S3 j = Pi S3 ! SI a£2 i P, SI . Pi S2 , + P\S3 S SI f\S2\P\SI \Pi S2 , 

_ _ _ _ _ _ (6.84) 

+P>S3f S\a.S2iP<S\<PiS2> + P\ S3!S1aS 2\P\ SbP<S2> 


L'application numérique donne donc pour la probabilité implicite d'une alarme: 


P[S3'\ = 75% ■ 1% • 0.1% + 99% • 99% • 0.1% +10% ■ 1% - 99.9% +10% • 99% ■ 99.9% 
= 10.089% 


(6.85) 


Ce qui se construit et se vérifie de la manière suivante avec MSBNX 1.4.2: 



No (0.99) 


Alarme^ 


ArnetProduction 


m 

No {0 .$99112) 




(ArnetPrdduction) 


m : A;îes;ivient (Motfd: Modd, Noce: Alflrn») 


Pdltlït IÏO<lc15) 

AUmrc I 


AC Clie nt Tï jti.iil 


Mû 

bm çhaitj | 

Yk 

Ybï 

0.75 

125 

hhI 

Ho 

033 

0.01 

mm 

M _ 

Vas 

0.1 



NO 

No 

0.1 

13 




3 


Evacuation 

Evacuation) 




Figure: 6.14 - Probabilité implicite d'une alarme dans MSBNX 1.4.2 

Concernant les notations, il peut être utile au lecteur de savoir qu'il peut parfois trouver dans la littérature: 


P[S3!S\ = Oui,£2 = Ouii = PiS3!S\,S2\ = P[S3l S\f\S2) (6.86) 


Remarque : Dans l'exemple particulier étudié ici les événements ont tous deux états. Mais dans la 
pratique cela peut aller à 3, 4 et plus. Dès lors les tableaux de croisement de probabilités deviennent 
vite énormes. 


Comme pour les cas précédents, supposons que nous savons qu'il y a eu un accident de travail. Nous 
souhaitons alors calculer la probabilité a priori d'une alarme. Nous avons alors (observez que la 
probabilité ne dépend effectivement alors plus que de l'état S2 puisque l'état SI est entièrement connu!): 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


272/4839 









































Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


P[S3i S\) = Pi 33/ S1,S2>P[ S2) + P\ S3f Sl,S2\P\ S2 ■ 
= 75% • 0.1% +10% ■ 99.9% = 10.065% 


(6.87) 


Ce que nous pouvons aussi vérifier avec le logiciel MSBNX 1.4.2: 


5^' Mic'osoft Bei’ef Networks: Eva „ating ’Model' - [Evaluation: 0] 


B- File View Window Help 

Dkl f| 


□ □V Model 

i. 

- Alarme 

.ArretProduction 

.Evacuation 

.PanneMachine 


ÀccidenlTravail = Yes 


Spreadsheet | BarChart | Recommendations 1 


tJnobserved 
V K Yes 


fe 1 


No 


|Node Name 

State 0 

State 1 

| Alarme 

Yes 

No 


0.1007 

0.8994 



Figure: 6.15 - Probabilité implicite d’une alarme dans MSBNX 1.4.2 


Ainsi, savoir qu'il y a eu un accident de travail augmente la probabilité qu'il y ait bien une alarme (nous 
passons d'une probabilité de 10.089% à 10.65%). 


Pour terminer cet exemple, nous souhaiterions calculer les probabilités a posteriori Pi S,2 f S3< et 

P<Slf S3>. Pour cela, nous devons d'abord calculer les probabilités a priori P< S3 > S2 < et P[S3! £1' 
(cette dernière venant d'être calculée). 

Nous avons pour la valeur manquante (ce qui se vérifie aussi facilement qu'avant avec le logiciel MSNBX 
1.4.2): 


P. £3 / £2 . = P. £3 / S2,S\ . P, SI. + Pi S3f S2, SI . P<SI I 
= 75% ■ 1% + 99% ■ 99% = 98.76% 


( 6 . 88 ) 


Nous avons donc: 


P< S3f SI < = 10.065% 

(6.89) 

P< S3i S2> = 98.76% 


Nous avons maintenant tout ce qu'il faut pour calculer la probabilité a priori de P> S3 / S2 ■ et P ' S3f SI < 


P> S3fS2\ P(S2) _ 98.76% • 0.1% 
P>S 3- 10.089% 

PiS3fSbP(SÏ) _ 10.065% 1% _ 
P[S3) ~ 10.089% 


= 0.9789% 

0.9976% 


(6.90) 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


273/4839 










































Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

Donc la probabilité a priori qu'il y ait une panne machine lorsque nous savons qu'il y a une alarme est de 
0.979% (donc in extenso 99.021% que le déclenchement de l'alarme ne soit pas dû a priori à une panne 
machine). Respectivement il y a, a priori, 0.998 % de probabilité y ait un accident de travail lorsque nous 
savons qu'il y a une alarme (et donc 99.002 % que cela ne soit pas dû a priori à un accident de travail). 

Du point de vue critique, lorsqu'il y a donc une alarme finalement nous ne pouvons pas dire grand chose. 
Cela est dû dans le cas présent au fait que les événements d'intérêt notable ont tous deux de faibles 
probabilités d'avoir lieu (accident et panne machine) et que les gens réagissent plutôt bien au niveau du 
déclenchement de l'alarme (sinon si les probabilités a priori étaient grandes cela signifierait que le 
comportement n'est pas bon puisque nous pouvons deviner (avec exaspération) à l'avance quel problème a 
lieu avec une certaine confiance). 

Remarque: Nous n'avons pas trouvé comment vérifier ces derniers calculs avec MSNBX 1.4.2. Si 
quelqu'un trouve comment le faire ce serait super de nous communiquer le détail de la démarche. 

Pour clore, le lecteur aura remarqué que les calculs peuvent vite devenir ennuyeux dès que le graphe 
devient complexe d'où l'usage de logiciels informatiques. De plus, dans le domaine bancaire qui utilise par 
exemple les réseaux bayésiens pour les risques de crédit, la probabilité a priori peut être plus complexe. 
Par exemple nous pourrions vouloir connaître la probabilité a priori qu'il y ait une panne machine sachant 
que nous avons une alarme et un accident de travail: 


PiS2fS3,Sb = PiS2fS3= Oui,£l = Oui i (6.91) 


1.3. MARTINGALES 


Une martingale en probabilités (il en existe une autre dans les processus stochastiques) est une technique 
permettant d'augmenter les chances de gain aux jeux de hasard tout en respectant les règles de jeu. Le 
principe dépend complètement du type de jeu qui en est la cible, mais le terme est accompagné d'une aura 
de mystère qui voudrait que certains joueurs connaissent des techniques secrètes mais efficaces pour 
tricher avec le hasard. Par exemple, de nombreux joueurs (ou candidats au jeu) cherchent LA martingale 
qui permettra de battre la banque dans les jeux les plus courants dans les casinos (des institutions dont la 
rentabilité repose presque entièrement sur la différence - même faible - qui existe entre les chances de 
gagner et celles de perdre). 

De nombreuses martingales ne sont que le rêve de leur auteur, certaines sont en fait inapplicables, 
quelques-unes permettent effectivement de tricher un peu. Les jeux d'argent sont en général inéquitables: 
quel que soit le coup joué, la probabilité de gain du casino (ou de l'État dans le cas d'une loterie) est plus 
importante que celle du joueur. Dans ce type de jeu, il n'est pas possible d'inverser les chances, seulement 
de minimiser la probabilité de ruine du joueur. 

L'exemple le plus courant est la martingale de la roulette. Elle consiste à jouer une chance simple à la 
roulette (noir ou rouge, paire ou impaire) de façon à gagner, par exemple, une unité dans une série de 
coups en doublant sa mise si l'on perd, et cela jusqu'à ce que l'on gagne. Exemple: le joueur mise 1 unité 
sur le rouge, si le rouge sort, il arrête de jouer et il a gagné 1 unité (2 unités de gain moins l'unité de mise), 
si le noir sort, il double sa mise en pariant 2 unités sur le rouge et ainsi de suite jusqu'à ce qu'il gagne. 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


274/4839 








[SCIENCES.CH] 



Figure: 6.16 - Roulette de casino 


Ayant une chance sur deux de gagner, il peut penser qu'il va finir par gagner ; quand il gagne, il est 
forcément remboursé de tout ce qu'il a joué, plus une fois sa mise de départ. 

Cette martingale semble être sûre en pratique. À noter que sur le plan théorique, pour être sûr de gagner, 
il faudrait avoir la possibilité de jouer au cas où un nombre de fois illimité.... Ce qui présente des 
inconvénients majeurs: 

Cette martingale est en fait limitée par les mises que le joueur peut faire car il faut doubler la mise à 
chaque coup tant que l'on perd: 2 fois la mise de départ, puis 4, 8, 16.... s'il perd 10 fois de suite, il doit 
pouvoir avancer 1024 fois sa mise initiale pour la 1 le partie ! Il faut donc beaucoup d'argent pour gagner 
peu.ü 

Les roulettes comportent de plus un "0" qui n'est ni rouge ni noir. Le risque de perdre lors de chaque coup 
est ainsi plus grand que 1/2... 

De plus, pour paralyser cette stratégie, les casinos proposent des tables de jeu par tranche de mise: de 1 à 
100.-, de 2 à 200.-, de 5 à 500.-,... Impossible donc d'utiliser cette méthode sur un grand nombre de coups, 
ce qui augmente le risque de tout perdre. 

Le black jack est un jeu qui possède des stratégies gagnantes: plusieurs techniques de jeu, qui nécessitent 
généralement de mémoriser les cartes, permettent de renverser les chances en faveur du joueur. Le 
mathématicien Edward Thorp a ainsi publié en 1962 un livre qui fut à l'époque un véritable best-seller. 
Mais toutes ces méthodes demandent de longues semaines d'entraînement et sont facilement décelables 
par le croupier (les brusques changements de montant des mises sont caractéristiques). Le casino a alors 
tout loisir d'écarter de son établissement les joueurs en question. 

Il faut noter qu'il existe des méthodes assez évoluées. L'une d'elles repose sur les combinaisons les moins 
jouées. Dans les jeux où le gain dépend du nombre de joueurs gagnants (Loto...), jouer les combinaisons 
les moins jouées optimisera les gains. C'est ainsi que certaines personnes vendent des combinaisons qui 
seraient statistiquement très rarement utilisées par les autres joueurs. 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 









Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

Partant de ce raisonnement, on peut encore conclure qu'un joueur qui aurait réussi à déterminer ainsi les 
combinaisons statistiquement les moins jouées, afin d'optimiser son espérance de gain, ne sera en fait 
certainement pas le seul joueur à avoir obtenu par l'analyse ces fameuses combinaisons! Cela revient à 
dire que les numéros en théorie les moins joués sont en fait surjoués par combinaisons, le mieux serait 
peut-être de réaliser un savant mélange de numéros sous-joués et de numéros surjoués pour obtenir les 
combinaisons idéales. Une autre conclusion à tout cela est peut-être que le mieux est encore de jouer des 
combinaisons aléatoires qui ont finalement moins de chance d'être également choisies par les joueurs qui 
incorporent un facteur humain et harmonieux dans le choix de leurs nombres. 

2, ANALYSE COMBINATOIRE 


"L'analyse combinatoire" (techniques de dénombrement) est le domaine de la mathématique qui s'occupe 
de l'étude de l'ensemble des issues, événements ou faits (distinguables ou non tous distinguables) avec 
leurs arrangements (combinaisons) ordonnés ou non selon certaines contraintes données. 

Définitions: 

Dl. Une suite d'objets (événements, issues, objets,...) est dite "ordonnée" si chaque suite composée d'un 
ordre particulier des objets est comptabilisée co mm e une configuration particulière. 

D2. Une suite est donc "non ordonnée" si et seulement si nous intéresse la fréquence d'apparition des 
objets indépendamment de leur ordre. 

D3. Des objets (d'une suite) sont dits "distincts" si leurs caractéristiques ne permettent pas de les 
confondre avec des autres objets. 


Remarque : Nous avons choisi de mettre l'analyse combinatoire dans ce chapitre car lorsque nous 
calculons des probabilités, nous avons également assez souvent besoin de savoir quelle est la 
probabilité de tomber sur une combinaison ou un arrangement d'événements donnés sous certaines 
contraintes. 


Souvent les étudiants ont de la peine à se rappeler de la différence entre une permutation, un arrangement 
et une combinaison. Voici donc un petit résumé de ce que nous allons voir: 

- Permutation: On prend tous les éléments. 

- Arrangement: On choisit des éléments parmi ceux de l'ensemble de départ et l'ordre intervient 

- Combinaison: Idem que pour l'arrangement mais l'ordre n'intervient pas 

Il existe plusieurs types d'arrangements selon les contraintes et les propriétés des éléments arrangés. Nous 
allons présenter et démontrer ci-dessous les 5 cas les plus répandus à partir desquels nous pouvons trouver 
(habituellement) tous les autres: 

2.1. ARRANGEMENTS SIMPLES AVEC RÉPÉTITION 


Définition: Un "arrangement simple avec répétition" est une suite ordonnée de longueur m âen objets 
distincts non nécessairement tous différents dans la suite (soit avec répétitions possibles!). 

Soient A et B deux ensembles finis de cardinaux respectifs m, n tels que trivialement il y ait m façons de 
choisir un objet dans A (de type a) et n façons de choisir un objet dans B (de type b). 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


276/4839 












Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

Nous avons vu dans le chapitre de Théorie Des Ensembles que si A et B sont disjoints, que: 

Card (j4u 5) = m +n (6.92) 


Nous en déduisons donc les propriétés suivantes: 

PL Si un objet ne peut être à la fois de type a et de type b et s'il y a m façons de choisir un objet de type 
a et n façons de choisir un objet de type b, alors l'union des objets donne m + n sélections (c'est 
typiquement le résultat des requêtes d'UNION en SQL, sans filtres, dans les SGBDR des entreprises). 

P2. Si nous pouvons choisir un objet de type a de m façons puis un objet de type b de n façons, alors il y a 
selon le produit cartésien de deux ensembles (cf. chapitre de Théorie Des Ensembles): 

Card (j4 x B) = Card Q4) ■ Card ( B ) = m • n ( 6 . 93 ) 


de manières choisir un seul et unique objet de type a puis un objet de type b (this is typically the resuit of 
SELECT queries in SQL, without filters, with several unrelated tables in corporate RDBMS). 


Avec les mêmes notations pour m et n, nous pouvons donc choisir pour chaque élément de A, son unique 
image parmi les n éléments de B. Il y a donc n façons de choisir l'image du premier élément de A, puis 
aussi n façons de choisir l'image du deuxième élément de A, ..., puis n façons de choisir l'image du m-ème 
élément de A. Le nombre d'applications totales consécutives possibles de A dans B est donc égal aux m 
produits de n ( m fois le produit cartésien du cardinal de l'ensemble B avec lui-même donc!). Ce qu'il est 
d'usage d'écrire (nous avons mis les différentes écritures que l'on peut trouver dans les livres scolaires): 


Card i B A i = Card 


\ 

BxBx xB 

■ - , - ’ 

\ m fois / 


= Card « B i = 4^ = 


(6.94) 


où b a est l'ensemble des applications de A dans B. La progression du nombre de possibilités est donc 
géométrique (et non "exponentielle" comme il est souvent dit à tort!). 

Ce résultat mathématique est assimilable au résultat ordonné (un arrangement ^ 4 ” dont l'ordre des 
éléments de la suite est pris en compte) de m tirages dans un sac contenant n boules différentes avec 
remise après chaque tirage. 

Exemples: 

El. Combien de "mots" (ordonnés) de 7 lettres pouvons-nous former à partir d'un alphabet de 24 lettres 
distinctes (très utile pour connaître le nombre d'essais pour trouver un mot de passe par exemple)? La 
solution est: 


Al = 24 7 =4'586 , 471'4 24 (6-95) 

E2. Combien de groupes d'individus aurons-nous lors d'une votation sur 5 sujets et où chacun peut être 
soit accepté, soit rejeté? La solution (très utilisée dans les entreprises en Suisse) est: 

Âl = 2 5 = 32 (6.96) 

Une généralisation simple de ce dernier résultat peut consister dans l'énoncé du problème suivant: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


277/4839 










Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

Si nous disposons de m objets ^,..., k 7n tels que k- peut prendre n- états différents alors le nombre de 
combinaisons possibles est: 


4™=*i ^ ( 6 - 97 ) 

Et si nous avons «j = n 2 = ... = alors nous retombons sur: 

A* = A™ = n l n 2 ...n i ...n K = (6.98) 


Exemple: 

Un graphiste a créé sous le logiciel Adobe Photoshop une maquette d'une site Internet avec trois en-têtes 
différentes, deux variantes pour le corps, quatre variantes pour le fond, six variantes de menus et trois 
variantes pour le pied de pages. Le nombre total de combinaisons (compositions dans le langage du 
graphiste) que l'on pourra présenter au client sera de: 

Ah = 3- 2-4-6- 3=432 (6.99) 

2.2. PERMUTATIONS SIMPLES SANS RÉPÉTITION 


Définition: Une "permutation simple sans répétition" (appelée anciennement "substitution") de n objets 
distincts est une suite ordonnée (différente) de ces n objets par définition tous différents dans la suite (sans 
répétition). 


Remarque : Attention à ne pas confondre le concept de permutation (de n éléments entre eux) et 
d'arrangement (de n éléments parmi m)\ 


Le nombre de permutations de n éléments peut être calculé par récurrence: il y a n places pour un premier 
élément, n -1 pour un deuxième élément,..., et il ne restera qu'une place pour le dernier élément restant. 

Il est dès lors trivial que nous aurons un nombre de permutations donné par: 

n ■ {n -1) ■ (« - 2) ■ (n - 3)...(« - {n -1)) (6.100) 


Rappelons que le produit: 


H 

n • in -1) ■ in - 2) ■ {n - 3)...(« - in - 1)) = ]~[j (6.101) 

z-l 


est appelé "factorielle de n" et nous la notons n\ pour n e N. 
Il y a donc pour n éléments distinguables: 


A = »i 


( 6 . 102 ) 


permutations possibles. Ce type de calcul peut être par exemple utile en gestion de projets (calcul du 
nombre de manière différentes de recevoir dans une chaîne de production n pièces toutes différentes 
commandées chez des fournisseurs externes). 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


278/4839 












Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

Exemple: 

Combien de "mots" (ordonnés) de 7 lettres distinctes sans répétition pouvons-nous former? 

= 7 ! = 5040 ( 6 . 103 ) 

Ce résultat nous amène à l'assimiler au résultat ordonné (un arrangement 4s dont l'ordre des éléments de 
la suite est pris en compte) du tirage de toutes les boules différentes d'un sac contenant n boules 
distinguables sans remise. 

2.3. PERMUTATIONS SIMPLES AVEC RÉPÉTITION 


Définition: Lorsque nous considérons le nombre de permutations ordonnées (différentes) d'une suite de n 
objets distincts tous nécessairement non différents dans une quantité donnée dans la suite nous parlons de 
"permutation simple avec répétition". 


Remarque : Il ne faut pas confondre cette dernière définition avec "l'arrangement avec répétition" vu 
plus haut! 


Lorsque certains éléments ne sont pas tous distinguables dans une suite d'objets (ils sont répétitifs dans la 
suite), alors le nombre de permutations que nous pouvons constituer se réduit alors assez trivialement à un 
nombre plus petit que si tous les éléments étaient tous distinguables. 

Soit le nombre d'objets du type i, avec: 


n \ +fî 2 +■■■ + »* = n ( 6 . 104 ) 


alors, nous notons: 


An ( 6 . 105 ) 

avec ï = 1,2 ,...,k le nombre de permutations possibles (pour l'instant inconnu) avec répétition (un ou 
plusieurs éléments répétitifs dans une suite d'éléments sont non distinguables par permutation). 

Si chacune des places occupées par des éléments identiques était occupée par des éléments différents, 
le nombre de permutations serait alors à multiplier par chacun des ! (cas précédent). 

Il vient alors que nous retombons sur la factorielle telle que: 

A C»i,«a .» 3 >•••>«*)'!-■»*! "»! ( 6 - 106 ) 


dont nous déduisons immédiatement: 


A (fh,*2’ n 3 --»*) = 


fl ! 


»i ! '«2 !■ «3 ! • ■%! 


( 6 . 107 ) 


Si les n objets sont tous différents dans la suite, nous avons alors: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


279/4839 










Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

«i ! = «2 ! = ... = ! = 1! = 1 (6.108) 


et nous nous retrouvons bien avec une permutation simple (sans répétition) telle que: 


A 


(U.1) 


im.,.1! 


(6.109) 


Il conviendra donc de se rappeler que les permutations avec répétition sont en plus petit nombre que 
celles sans répétition (évident puisque nous ne prenons pas en compte les permutations des éléments 
identiques entre eux!). 

Exemple: 


Combien de "mots" (ordonnés) pouvons-nous former avec les lettres du mot "Mississippi": 


11 ! 


M 1.2,4, 4 ) = 

ftftâs&s 1 ! 2 ! 4 ! 4 ! 


34'650 ( 6 . 110 ) 


Ce résultat nous amène à l'assimiler au résultat ordonné (une permutation A x dont l'ordre des éléments de 
la suite n'est pas pris en compte) du tirage de n boules non toutes distinguables d'un sac contenant k 1 n 
boules avec remise limitée pour chaque boule. 

2.4, ARRANGEMENTS SIMPLES SANS RÉPÉTITION 

Définition: Un "arrangement simple sans répétition" est une suite ordonnée de p objets tous distincts pris 
parmi n objets distincts avec p. 

Nous nous proposons donc maintenant de dénombrer les arrangements possibles sans répétition de p 
objets parmi n. Nous noterons 4f le nombre de ces arrangements. 

Il est aisé de calculer 4 = « 4 de vérifier que A? = n(n - 1). Effectivement, il existe n façons de choisir 
le premier objet et (n- 1) façons de choisir le deuxième lorsque nous avons déjà le premier. 

Pour déterminer A £, nous raisonnons alors par récurrence. Nous supposons 4f _1 connu et nous en 
déduisons: 


4 f = 4 T 1 ■[«-(*- 1 )] = 4" 1 ■ (»-p + 1 ) ( 6 . H 1 ) 

Dès lors: 

4f = « ' (fl “ 1) ' (« - 2) ■ (« - 3) ■... ■ (« - {p ~ 1)) (6.112) 

alors: 

n\ = A^ • {n - p)\ = [« ■ (« -1) ■ (« - 2) •... ■ (« -p + 2) • {n - p +!)]■ (« - p) - {n - p -1)... (6.113) 


d'où: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


280/4839 









Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


= 


n ! 

{n~j>)\ 


( 6 . 114 ) 


Ce résultat nous amène à l'assimiler au résultat ordonné (un arrangement 4f dont l'ordre des éléments de 
la suite est pris en compte) du tirage de p boules distinctes d'un sac contenant n boules différentes sans 
remise. 

Exemple: 

Soit les 24 lettres de l'alphabet, combien de "mots" (ordonnés) de 7 lettres distinctes pouvons-nous 
former? 


ÀL= — = 1744'364'160 (6 .ii5) 

* (24-7)! 


Le lecteur aura peut-être remarqué que si nous prenons P ~ n nous nous retrouvons avec: 


= 


n ! 

{n-p)\ 



( 6 . 116 ) 


donc nous pouvons dire qu'une permutation simple de n éléments est comme un arrangement simple sans 
répétition avec n = P . 

2.5. COMBINAISONS SIMPLES 


Définition: Une "combinaison simple" ou "choix" est une suite non-ordonnée (dont l'ordre ne nous 
intéresse pas!) de p éléments tous différents (pas nécessairement dans le sens visuel du terme!) choisis 

parmi n objets distincts et est par définition notée sur ce site Internet C* et appelée la "binomiale" ou 
"coefficient binomial". 

Si nous permutons les éléments de chaque arrangement simple de p éléments parmi n, nous obtenons 
toutes les permutations simples et nous savons qu'il y en a p\ d'où en utilisant la convention d'écriture du 
présent site internet (contraire à celle préconisée par la norme ISO 31-11!): 


r K = 

f y 

4' »i 



p\ p\{n-p)\ 


C'est une relation très souvent utilisée dans les jeux de hasard mais également dans l'industrie via la loi 
hypergéométrique (cf. chapitre de Techniques De Gestion) ainsi que dans les statistiques d'assez haut 
niveau comme les statistiques d'ordre (cf. chapitre de Statistiques). 

Ce résultat nous amène à l'assimiler au résultat non ordonné (un arrangement C* dont l'ordre des éléments 

de la suite n'est pas pris en compte) du tirage de p boules d'un sac contenant n boules différentes sans 
remise. 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


281/4839 















Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


Remarques : 

RL Nous avons nécessairement par construction C* < 4f . 

R2. Selon les auteurs nous inversons l'indice ou le suffixe de C il faut donc être prudent! 


Exemple: 


Soit un alphabet de 24 lettres, combien avons-nous de choix de prendre 7 lettres parmi les 24 sans prendre 
en compte l'ordre dans lequel sont triées les lettres: 


C* 


24! 

71(24-7)! 


346-104 (6.H8) 


La même valeur peut être obtenue avec la fonction COMBIN( ) de Microsoft Excel 11.8346 (version 
française). 

Il existe, relativement à la binomiale, une autre relation très souvent utilisée dans de nombreux cas 
d'études ou également de manière plus globale en physique ou analyse fonctionnelle. Il s'agit de la 
"formule de Pascal": 





( 6 . 119 ) 


Démonstration: 

c „-i +c „-i = («-!)! , («-!)! = («-!)! , («-!)! 

P_1 P ((»-l)-0?-l))!O-l)! (n-\- p)\p\ (n-p)\(p- 1)! (« -1 -;?)!;? ! 

Or p\ = p(p -1)! donc: 


P I 

" 1) ! = — (6.121) 

P 


et de même (« - p)(n - p-T>\ = (n-p)\: 


( „- p -i V =ktzÆ m22) 

n- p 


Ainsi: 


r-fH-1 | r-tn-l _ 

S-1 + ^P ~ 


(«- 1)1 


(«- 1)1 


(«~l)l 

(n-p)\p\ 


(n-p)\(p-ï)\ (n- p)\p\ (; n-p)\p\ 

{n - 1) ! n « ! 


(« -1 )\p | («-1 )!(«-/>) 

(n-p)\p\ 


( 6 . 123 ) 


[p + (n~P)] = 


(n-p)\p\ {n 


- C n 

■p)\p\ p 


□C.Q.F.D. 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


282/4839 




















Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

Pour résumer: 


Type 

Expression 

Arrangement simple avec répétition 


Arrangement simple sans répétition 


Permutation simple sans répétition 

A = »i 

Permutation simple avec répétition 

, , , , 

«1 ! '«2 ! -'»Jt ! 

Combinaison simple 

(cas de l'arrangement simple sans répétition où 
l'ordre n'est pas pris en compte) 

c n _ n _ Al « ! 

m \mJ m\ m ï ! 


Tableau: 28.2 - Résumé des cas possibles 



3. CHAÎNES DE MARKOV 


Les chaînes de Markov sont des outils statistiques et probabilistes simples et puissants mais dont la forme 
de présentation mathématique prête parfois à l'horreur.... Nous allons tenter ici de simplifier un maximum 
les notations pour introduire cet outil formidable très utilisé au sein des entreprises pour gérer la 
logistique, les files d'attentes aux centrales d'appel ou aux caisses de magasins jusqu'à la théorie de la 
défaillance pour la maintenance préventive, en physique statistique ou en génie biologique (et la liste est 
encore longue et pour plus de détails le lecteur pourra se reporter aux chapitres concernés disponibles sur 
le site...). 

Définitions: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


283/4839 































Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

Dl. Nous noterons { X(t)} un processus probabiliste fonction du temps dont la valeur à chaque instant 

dépend de l'issue d'une expérience aléatoire. Ainsi, à chaque instant t, X(t) est donc une variable aléatoire 
que nous désignons par "processus stochastique" (pour plus de détails dans le cadre de finance, voir le 
chapitre d'Économie). 

D2. Si nous considérons un temps discret, nous notons alors {un "processus stochastique à temps 
discret". 

D3. Si nous supposons en outre que les variables aléatoires X n ne peuvent prendre qu'un ensemble 
discret de valeurs nous parlons alors de "processus à temps discret et à espace discret". 


Remarque : Il est tout à fait possible comme dans l'étude du télétrafic (cf. chapitre Techniques De 
Gestion) d'avoir un processus à temps continu et à espace d'états discrets. 


Définition: {est une "chaîne de Markov" si et seulement si: 

- j | X^ - i„-i,X n _ 2 - ï„_ 2 ,•••, X Q - ^ ) = P{X n - j | X n _ Y - ) (6.124) 

en d'autres termes (c'est très simple!) la probabilité pour que la chaîne soit dans un certain état à la n-ème 
étape du processus ne dépend que de l'état du processus à l'étape n -1 et pas des étapes précédentes! 


Remarque : Done en probabilités un processus stochastique vérifie la propriété markovienne ci-dessus 
si et seulement si la distribution conditionnelle de probabilité des états futurs, étant donné l'instant 
présent, ne dépend que de ce même état présent et pas des états passés. Un processus qui possède cette 
propriété est aussi appelé "processus de Markov". 


Définition: Une "chaîne de Markov homogène" est une chaîne telle que la probabilité qu'elle a pour 
passer dans un certain état à la «-ièine étape soit indépendante du temps. En d'autres termes, la loi de 
probabilité caractérisant la prochaine étape ne dépend pas du temps (de l'étape précédente), et en tout 
temps la loi de probabilité de la chaîne est toujours la même pour caractériser la transition à l'étape en 
cours. 


Nous pouvons alors définir (réduire) la loi de "probabilité de transition" d'un état i vers un état j par: 


Pÿ=P(X»=J l^*-l=0 (6.125) 

Il est alors naturel de définir la "matrice de transition" ou "matrice stochastique": 


Pl 1 

Pl 2 

P21 

P22 

- 

P32 


P23 


(6.126) 


comme la matrice qui contient donc tous les probabilités possibles de transitions des états d'un graphe 
d'états orienté. 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


284/4839 










Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

Les chaînes de Markov peuvent être représentées graphiquement sous la forme d'un graphe orienté G (cf. 
chapitre de Théorie Des Graphes) appelé parfois "automate" ayant pour sommet les points (états) i et pour 
arêtes les couples orientés (/, /). Nous associons alors à chaque composante un arc orienté et sa probabilité 
de transition. 

Exemple: 



Figure: 6.17 - Exemple générique d’une chaîne de Markov 


Ainsi, dans l'exemple du graphe orienté ci-dessus, les seules transitions permises par les 4 états (matrice 
4x4) ci-dessus sont celles indiquées par les flèches. Ce qui fait que la matrice de transition se simplifie 
alors en: 


>11 

Pu 

Pu 

P\A~ 


' 0 

Pu 

0 

* 14 " 

^21 

PT! 

P23 

P2A 


0 

0 

P22 

0 

P31 

P32 

P33 

P3A 


^31 

0 

P22 

0 

PA 1 

PA2 

P A3 

P AA. 


PA 1 

0 

0 

0 _ 


où le lecteur remarquera que nous avons la propriété triviale (par construction!) que la somme des termes 
(probabilités) d'une ligne de la matrice P est toujours unitaire (et donc que la somme des termes d'une 
colonne de la transposée de la matrice P est toujours unitaire aussi): 


Z>ÿ _:1 (6.128) 

J 

et que la matrice est positive (ce qui signifie que tous ces termes sont positifs ou nuis). 


Remarque : Se rappeler que la somme des probabilités des colonnes obtenues est toujours égale à 1 
pour la transposée de la matrice stochastique! ! 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


285/4839 












Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

L'analyse du régime transitoire (ou: promenade aléatoire) d'une chaîne de Markov consiste à déterminer 
(ou à imposer à!) la matrice-colonne (vecteur) p(n ) d'être dans un état donné à la «-ième étape de la 
promenade: 




Pi») = 


Pli») 

P 2 i») 


(6.1) 


\PCard{.E) (»); 


avec la somme des composantes qui vaut évidemment toujours 1 (car la somme des probabilités de se 
trouver dans un quelconque des sommets du graphe à un moment/étape donné(e) doit être égale à 100%). 

Nous appelons fréquemment cette matrice-colonne "vecteur stochastique" ou "mesure de probabilité sur 
le sommet/". 


Démonstration: 

Démontrons que la probabilité de ce vecteur stochastique est effectivement toujours unitaire. 
Si p{n ) est un vecteur stochastique, alors son image: 

/>(« + !) = ■ pi») (6.2) 


l'est aussi. Effectivement, 


^■(«+ 1 )> 0 


car: 


Pii»+^)='Z i PijPji») (6.3) 


est une somme de termes positifs ou nuis. De plus, nous trouvons: 


2aC» +1 ) = SZ^jC») = ZZ^jC») = S Z p ÿ p j i»)=T J Pji n ) = l (6-4) 

1 2 3 3 2 3 V / 3 


□C.Q.F.D. 

Ce vecteur de probabilités, dont les composantes sont positives ou nulles, dépend (c'est assez intuitif) de 
la matrice de transition P et du vecteur de probabilités initiales /?(0). 

Bien que cela soit démontrable (théorème de Perron-Frobenius) le lecteur pourra vérifier par un cas 
pratique (informatisé ou non!) que si nous choisissons un vecteur d'état pin) quelconque alors il existe 
pour toute matrice stochastique P un vecteur unique de probabilité noté traditionnellement n tel que: 

P T ■ JT = JT (6.5) 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


286/4839 










Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

Une telle mesure de probabilité n vérifiant la relation précédente est appelée une "mesure invariante" ou 
"mesure stationnaire" ou encore "mesure d'équilibre" qui représente l'état d'équilibre du système. En 
termes d'algèbre linéaire (voir chapitre du même nom), pour la valeur propre 1, n est un vecteur propre 

de P (cf. chapitre d'Algèbre Linéaire). 

Nous en verrons un exemple trivial dans le chapitre de Théorie des Graphes qui sera redéveloppé sous 
forme détaillée et complète ainsi que dans le chapitre de Théorie Des Jeux Et De La Décision dans le 
cadre de la pharmaco-économie. Mais signalons également que les chaînes de Markov sont également 
utilisées en météorologie par exemple ou encore dans le domaine de la casse de mots de passe 
informatiques: 



Figure: 6.1 - Exemple concret très simpliste d'une chaîne de Markov 

ou dans le domaine médical, financier, des transports, du marketing, etc. 

Dans le domaine du language, à partir de l'analyse fréquentielle de séquence de mots, les ordinateurs 
arrivent à construire aussi des chaînes de Markov et donc à proposer une sémantique plus correcte lors de 
corrections grammaticales informatisées ou de transcription de écrite de présentations orales. 

Enfin pour clore, donnons quelques définitions de vocabulaire complémentaires courantes que l'on 
retrouvera dans différentes chapitres comme celui de Techniques de Gestion ou de Génie Industriel. 

Définitions: 

Dl. Une chaîne de Markov est dite "chaîne de Markov irréductible" si tous les états sont liés aux autres 
(c'est le cas de la chaîne dans la figure ci-dessus). 

D2. Une chaîne de Markov est dite "chaîne de Markov absorbante" si un quelconque des états de la 
chaîne absorbe les transitions (donc rien n'en sort pour dire simplement les choses!). 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


287/4839 


















Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 



[Vincent ISOZ] | http://www.sciences.ch] | Page: 


288/4839 






















































































Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


289/4839 






















































































Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


290/4839 






















































































Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


291/4839 






















































































Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


7. STATISTIQUES 


1-^/a statistique est une science qui a pour objet le groupement méthodique de faits ou événements 

répétitifs qui se prêtent à une évaluation numérique ou qualitative dans le temps suivant une loi donnée. 
Dans l'industrie et dans l'économie en général, la statistique est une science qui permet dans un 
environnement incertain de faire des inférences valides. 

Il faut savoir que parmi tous les domaines de la mathématique, celui qui est utilisé à la plus large échelle 
dans les entreprises et centres de recherches est bien la statistique et particulièrement depuis que des 
logiciels en facilitent grandement les calculs! Raison pour laquelle ce chapitre est un des plus gros du 
site internet alors que seuls les concepts élémentaires y sont présentés! 

Signalons aussi que les statistiques ont très mauvaise réputation à l'université car les notations y sont 
souvent confuses et varient grandement d'un professeur à l'autre, d'un livre à l'autre, d'un praticien à 
l'autre. En toute rigueur, il faudrait se conformer au vocabulaire et notations de la norme 
ISO 3534-1:2006 et comme malheureusement ce chapitre a été écrit avant la publication de cette 
norme... un certain temps d'adaptation sera nécessaire avec qu'il y ait conformité. 

Il est peut être inutile de préciser que la statistique est beaucoup utilisée en ingénierie, physique 
théorique, physique fondamentale, économétrie, gestion de projets ainsi que dans l'industrie des 
processus, dans les domaines des assurances vies et non vies, dans l'actuariat ou dans la simple analyse 
de banque de données (avec Microsoft Excel très souvent... malheureusement....) et la liste est encore 
longue. Par ailleurs, nous rencontrerons les outils présentés ici assez souvent dans les chapitres de 
Mécanique des Fluides, de Thermodynamique, des Techniques de Gestion, du Génie Industriel et 
d'Économétrie (en particulier dans ces deux dernières). Le lecteur pourra donc s'y reporter pour avoir 
des applications pratiques concrètes de quelques-uns des éléments théoriques les plus importants qui 
seront vus ici. 

Signalons également que outre les quelques exemples simples donnés sur ces pages, de nombreux autres 
exemples applicatifs sont donnés sur le serveur d'exercices du site dans les catégories Probabilités et 
Statistiques, Génie Industriel, Économétrie et Techniques de Gestion. 

Définition: Le but principal de la statistique est de déterminer les caractéristiques d'une population 
donnée à partir de l'étude d'une partie de cette population, appelée "échantillon" ou "échantillon 
représentatif'. La détermination de ces caractéristiques doit permettre aux statistiques d'être un outil 
d'aide à la décision! 


Remarque : Le traitement des données concerne la "statistique descriptive". L'interprétation des 
données à partir des estimateurs s'appelle "l'inférence statistique" (ou "statistique inférentielle"), et 
l'analyse de données en masse la "statistique fréquentielle" (en opposition à l'inférence bayésienne). 


Lorsque nous observons un événement prenant en compte certains facteurs, il peut arriver qu'une 
deuxième observation ait lieu dans des conditions qui semblent identiques. En répétant ces mesures 
plusieurs fois sur différents objets supposés similaires, nous pouvons constater que les résultats 
observables sont distribués statistiquement autour d'une valeur moyenne qui est, finalement le résultat 
possible le plus probable. Dans la pratique, nous n'effectuons cependant parfois qu'une seule mesure et 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


292/4839 












Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

il s'agit alors de déterminer la valeur de l'erreur que nous commettons en adoptant celle-ci comme 
moyenne mesurée. Cette détermination nécessite de connaître le type de distribution statistique auquel 
nous avons affaire et c'est ce que nous allons nous attarder (entre autres) à étudier ici (les bases du 
moins!). Il existe cependant plusieurs approches méthodologiques courantes (les moins courantes 
n'étant pas citées pour l'instant) face au hasard: 

1. Une toute première consiste à ignorer purement et simplement les éléments aléatoires, pour la bo nn e 
raison que l'on ne sait pas comment les intégrer. Nous utilisons alors la "méthode des scénarios" appelée 
aussi "simulation déterministe". C'est typiquement un outil utilisé par les financiers ou gestionnaires non 
diplômés travaillant avec des outils comme Microsoft Excel (qui inclut un outil de gestion de scénarios) 
ou MS Project (qui inclut un outil du type scénarios déterministes du type optimiste, pessimiste, 
attendu). 

2. Une seconde approche envisageable, quand nous ne savons pas associer des probabilités précises aux 
futurs événements aléatoires, est la théorie des jeux (cf. chapitre de la Théorie Des Jeux Et De La 
Décision) où l'on utilise des critères de sélection semi-empiriques comme le critère du maximax, du 
minimax, de Laplace, de Savage, etc. 

3. Enfin, quand nous pouvons lier des probabilités aux événements aléatoires, soit que ces probabilités 
découlent de calculs ou de mesures, soit qu'elles reposent sur une expérience acquise auprès de 
situations antérieures de même nature que la situation actuelle, nous pouvons faire appel aux 
statistiques descriptives et inférentielles (contenu du présent chapitre) pour tirer des informations 
exploitables et pertinentes de cette masse de données acquises. 

4. Une dernière approche quand nous avons connaissance de probabilités relatives aux issues 
intervenantes faisant suite à des choix stratégiques est l'utilisation de la théorie de la décision (cf. 

chapitre de la Théorie Des Jeux Et De La Décision). 


Remarques : 

RI. Sans la statistique mathématique, un calcul sur des données (par exemple une moyenne), n'est 
qu'un "indicateur ponctuel". C'est la statistique mathématique qui lui donne le statut d'estimateur 
dont on maîtrise le biais, l'incertitude et autres caractéristiques statistiques. Nous cherchons en 
général à ce que l'estimateur soit sans biais, convergeant et efficace (nous verrons lors de notre 
étude des estimateurs plus loin de quoi il s'agit exactement). 

R2. Lorsque nous communiquons une statistique il devrait être obligatoire de préciser l'intervalle de 
confiance ainsi que la taille de l'échantillon étudié et ses caractéristiques détaillées sinon quoi elle 
n'a quasiment aucune valeur scientifique. 

R3. Si vous avez un professeur ou un formateur qui ose vous enseigner les statistiques et 
probabilités avec des exemples basés sur des jeux de hasard (cartes, dés, allumette, pile ou face, 
etc.) débarrassez-vous en ou dénoncez-le à qui de droit car cela signifierait qu'il n'a aucune 
expérience pratique du domaine et qu'il va vous enseigner n'importe quoi et n'importe comment 
(normalement les exemples devraitent être basés sur l'industrie, l'économie ou la R&D, bref dans 
des domaines utilités tous les jours par les entreprises mais surtout pas sur des jeux de hasard...!). 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


293/4839 









Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

Introduisons avant de continuer quelques définitions qui vont nous être utiles pour la suite sur le 
concept d'échantillons et de moyennes: 

1. ÉCHANTILLONS 


Lors de l'étude statistique d'ensembles d'informations, la façon de sélectionner l'échantillon est aussi 
importante que la manière de l'analyser. Il faut que l'échantillon soit représentatif de la population (nous 
ne faisons pas nécessairement référence à des populations humaines!). Pour cela, l'échantillonnage 
aléatoire est le meilleur moyen d'y parvenir. 

Le statisticien part toujours de l'observation d'un ensemble fini d'éléments, que nous qualifions de 
"population". Les éléments observés, en nombre n, sont tous de même nature, mais cette nature peut 
être fort différente d'une population à l'autre. 

Définitions: 

Dl. Nous sommes en présence d'un "caractère quantitatif' lorsque chaque élément observé fait 
explicitement l'objet d'une même mesure. A un caractère quantitatif donné, nous associons une 
"variable quantitative" continue ou discrète qui synthétise toutes les valeurs possibles que la mesure 
considérée est susceptible de prendre (ce type d'information étant représenté par des courbes de loi de 
Gauss-Laplace, de la loi bêta, de la loi de Poisson, etc.). 


Remarque : Nous reviendrons sur le concept de "variable" en statistiques plus loin... 


D2. Nous sommes en présence d'un "caractère qualitatif' lorsque chaque élément observé fait 
explicitement l'objet d'un rattachement unique à une "modalité" choisie dans un ensemble de modalités 
exclusives (de type: homme | femme) permettant de classer tous les éléments de l'ensemble étudié selon 
un certain point de vue (ce type d'information étant représenté par des diagrammes à barre, fromages, 
diagrammes à bulles, etc.). L'ensemble des modalités d'un caractère peut être établi a priori avant 
l'enquête (une liste, une nomenclature, un code) ou après enquête. Une population étudiée peut être 
représentée par un caractère mixte, ou ensemble de modalités tel que genre, tranche salariale, tranche 
d'âge, nombre d'enfants, situation matrimoniale par exemple pour un individu. 

D3. Un "échantillon aléatoire" est un échantillon tiré au hasard dans lequel tous les individus d'une 
population ont la même chance, ou "équiprobabilité" (et nous insistons sur le fait que cette probabilité 
doit être égale), de se retrouver dans l'échantillon. 

D4. Dans le cas contraire d'un échantillon dont les éléments n'ont pas été pris au hasard, nous disons 
alors que l'échantillon est "biaisé" (dans le cas inverse nous disons qu'il est "non-biaisé") 


Remarque : Un petit échantillon représentatif est, de loin, préférable à un grand échantillon biaisé. 
Mais lorsque la taille des échantillons utilisés est petite, le hasard peut donner un résultat moins bon 
que celui qui est biaisé... 


2. MOYENNES 


La notion de "moyenne" ou "tendance centrale" (les financiers appellent cela aussi une "mesure de 
localisation"...) est avec la notion de "variable" à la base des statistiques. 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


294/4839 















Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

Cette notion nous semble très familière et nous en parlons beaucoup sans nous poser trop de questions. 
Pourtant il existe divers qualificatifs (nous insistons sur le fait que ce ne sont que des qualificatifs!) 
pour distinguer la forme de la résolution d'un problème consistant à calculer la moyenne. 

Il faut donc être très très prudent quant aux calculs de moyennes car il y a une fâcheuse tendance dans 
les entreprises à se précipiter et à utiliser systématiquement la moyenne arithmétique sans réfléchir, ce 
qui peut amener à de graves erreurs! Un exemple sympathique (pour faire un analogie) est qu'un 
nombre considérable de législations exigent seulement des seuils moyens de pollution par année alors 
que par exemple, fumer 1 cigarette par jour n'a pas le même impact que fumer 365 cigarette sur une 
année alors que les deux ont la même moyenne pris sur un an... C'est une preuve flagrante 
d'incompétence statistique du législateur. 

Voici un petit échantillon d'erreurs courantes: 

- Considérer que la moyenne arithmétique est la valeur qui coupe la population en deux parties égales. 

- Considérer que la moyenne de ratios du type objectifs/réalisés est pas égale au ratio des moyennes des 
objectifs et des moyennées des réalisations (alors que ce n'est pas la même chose!) 

- Considérer que la moyenne des salaires de différentes filiales est égale à la moyenne générale des 
salaires (alors que ceci n'est vrai que si et seulement si il y a le même nombre d'employés dans chaque 
filiale). 

- Considérer que la moyenne de la moyenne des lignes d'un tableau est toujours égal à la moyenne des 
moyennes des colonnes (alors que ceci n'est vrai que si et seulement si le contenu des cellules est non 
vide). 

Nous verrons ci-dessous différentes moyennes avec des exemples relatifs à l'arithmétique, au 
dénombrement, à la physique, à l'économétrie, à la géométrie et à la sociologie. Le lecteur trouvera 
d'autres exemples pratiques en parcourant l'ensemble du site. 

Définitions: Soient des nombres x i réels, nous avons alors: 

Dl. La "moyenne arithmétique" ou "moyenne empirique" (la plus communément connue) définie par le 
quotient de la somme des n valeurs observées x i par l'effectif total n: 



(7.1) 


et très souvent notée x ou encore fi est pour toute loi statistique discrète ou continue un estimateur 
sans biais de l'espérance. 

La moyenne arithmétique représente donc une mesure statistique exprimant la grandeur qu'aurait 
chacun des membres d'un ensemble de mesures si la somme doit être identique au produit de la 
moyenne par le nombre de termes. 

Si plusieurs valeurs occurrent plus d'une fois dans les mesures, la moyenne arithmétique sera alors 
souvent notée formellement: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


295/4839 








Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

/4 = ( 7 - 2 ) 

« i-1 

et appelée "moyenne pondérée par les effectifs". Enfin, indiquons que dans le cadre de cette démarche, 
la moyenne pondérée par les effectifs prendra le nom "d'espérance mathématique" dans le domaine 
d'étude des probabilités. 

Nous pouvons tout aussi bien utiliser les fréquences d'apparition des valeurs observées (dites 
"fréquence des classes"): 



n 


(7.3) 


Nous avons alors la "moyenne pondérée par les fréquences de classe": 




1 r r 

» w w » 



(7.4) 


Avant de continuer, indiquons que dans le domaine de la statistique il est souvent utile et nécessaire de 
regrouper les mesures/données dans des intervalles de classe de largeur donnée (voir les exemples plus 
loin). Il faut souvent faire plusieurs essais pour cela même s'il existe des formules semi-empiriques pour 
choisir le nombre de classes lorsque nous avons n valeurs à disposition. Une de ces règles 
semi-empiriques utilisée par de nombreux praticiens consiste à retenir le plus petit nombre entier de 
classes k tel que: 


2 k > n 


(7.5) 


la largeur de l'intervalle de classe étant alors obtenue en divisant l'étendue (différence entre la valeur 
maximale mesurée et la minimale) par k. Par convention et en toute rigueur... (donc rarement respecté 
dans les notations), un intervalle de classe est fermé à gauche et ouvert à droite: Cettre règle 

empirique se nomme la "règle de Sturges" et est basées sur le raisonnement suivant: 

Nous admettons que les valeurs du coefficient binomial C” donnent un histogramme idéal (nous 

laissons le lecteur vérifier cela simplement avec un tableau comme Microsoft Excel 11.8346 et la 
fonction COMBIN( ) qui y est disponible dans la version française). Au fur et à mesure que k devient 
grand l'histogramme ressemble de plus en plus à une courbe continue appelée "courbe Normale" que 
nous verrons plus loin. 


Dès lors, en nous basant sur le théorème binomial (cf. chapitre de Calcul Algébrique), nous avons: 


n=j\ Ç% a ”~PbP = T C%l”~PlP = f. C” = ■ a +b " = . 1 + 1 " = 2” (7.6) 

J3=0 p= 0 p= 0 

Ensuite, pour chaque intervalle i le praticien prendra par tradition la moyenne entre les deux bornes 
pour le calcul et la multipliera par la fréquence/) de classe correspondante. Dès lors, le regroupement 

en fréquence de classes fait que: 

1. La moyenne pondérée par les effectifs diffère de la moyenne arithmétique. 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


296/4839 







Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

2. Vue l'approximation effectuée elle sera un moins bon indicateur que la moyenne arithmétique. 

3. Elle est très sensible au choix du nombre de classes donc médiocre à ce niveau-là. 

Plus loin, nous verrons deux propriétés extrêmement importantes de la moyenne arithmétique et de 
l'espérance mathématique qu'il vous faudra absolument comprendre (moyenne pondérée des écarts à la 
moyenne et la moyenne des écarts à la moyenne). 


Remarque : Le "mode", noté Mod ou simplement M, est par définition la valeur qui apparaît le plus 
grand nombre de fois dans une série de valeurs. Dans Microsoft Excel 11.8346 (version française), 
soulignons que la fonction MODE( ) renvoie la première valeur dans l'ordre des valeurs ayant le 
plus grand nombre d'occurrences en supposant donc une distribution unimodale. 


D2. La "médiane" ou "moyenne milieu", notée M e (ou plus simplement M), est la valeur qui coupe une 

population en deux parties égales. Dans le cas d'une distribution statistique continue f(x ) d'une variable 
aléatoire X, il s'agit de la valeur qui représente 50% de probabilités cumulées d'avoir lieu tel que (nous 
détaillerons le concept de distribution statistique plus loin très en détails): 

M € +:o 

P(X<M e )= P(X>M e )= J f(x)dx = J f(x)dx = 0.5 (7.7) 

-œ M e 

Dans le cas d'une série de valeurs ordonnées x 1 ,x 2 ,...,x i ,...,x s ,la médiane est donc de par sa définition 

la valeur de la variable telle que l'on ait autant d'éléments qui ont une valeur qui lui est supérieure ou 
égale, que d'éléments qui ont une valeur qui lui est inférieure ou égale. Elle est principalement utilisée 
pour les distributions asymétriques, car elle les représente mieux que la moyenne arithmétique. 

Plus rigoureusement: 

- Si le nombre de termes est impair, de la forme 2n+l, la médiane de la série est le terme de rang n +1 
(que les termes soient tous distincts ou non!). 

- Si le nombre de termes est pair, de la forme 2 n, la médiane de la série est la demi-somme (moyenne 
arithmétique) des valeurs des termes de rang n et n + 1 (que les termes soient tous distincts ou non!). 

Dans tous les cas, de par cette définition, il découle qu'il y a au moins 50 % des termes de la série 
inférieurs ou égaux à la médiane, et au moins 50% des termes de la série supérieurs ou égaux à la 
médiane. 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


297/4839 








Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

Considérons par exemple la table de salaires ci-dessous: 


|n° Employé 

Salaire 

Cumul 

employés 

%Cumul 

employés 

1 

1200 

1 

6% 

2 

1220 

2 

12% 

3 

1250 

3 

18% 

4 

1300 

4 

24% 

5 

1350 

5 

29% 

6 

1450 

6 

35% 

7 

1450 

7 

41% 

8 

1560 

8 

47% 

9 

1600 

9 

53% 

10 

1800 

10 

59% 

11 

1900 

11 

65% 

12 

2150 

12 

71% 

13 

2310 

13 

76% 

14 

2600 

14 

82% 

15 

3000 

15 

88% 

16 

3400 

16 

94% 

17 

4800 

17 

100% 


Tableau: 7.1 - Identification de la médiane 


Il y a un nombre impair 2 / 7+1 de valeurs. Donc la médiane de la série est le terme de rang n+l. Soit 
l'600.- (résultat que vous donnera n'importe quel tableur informatique). La moyenne arithmétique 
quant à elle vaut 2'020. 

En relation directe avec la médiane il est important de définir le concept suivant afin de comprendre le 
mécanisme sous-jacent: 

Définition: Soit donnée une série statistique x 1; x 2 ,...,x i ,,..,x x , nous appelons "dispersion des écarts 
absolus" autour de x le nombre s '(x) défini par: 


( ? - 8 > 

s \x) est min imum pour une valeur de x la plus proche d'une valeur donnée x i au sens de l'écart 

absolu. La médiane est la valeur qui réalise ce min imum (extrémum)! L'idée va alors consister à étudier 
les variations de la fonction pour trouver le rang de cet extrémum. 

En effet, nous pouvons écrire: 

r n 

Vx e [x r ,x r+1 ],/’ e {1,2,3,...,«-1} s'(x) = - *|+ Z K ~ x \ 

2=1 2=r+l 


Donc par définition de la valeur x : 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


298/4839 



















































Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

r n 

= 2 K- _ *l 

2=1 2=r-U 

= [rx-f^ +x 2 + ... + x r )] + [(x Hl + .. + ^)-(«-^)^] 

= (2x-«)x + (x r4l + ... + x„)-(x 1 +x 2 +... + JT,) 

Ce qui nous permet donc de faire sauter les valeurs absolues est simplement le choix de l'indice r qui 
est pris de telle manière que la série de valeurs peut en pratique toujours être coupée en deux parties: 
tout ce qui est inférieur à un élément de la série indexé par r et tout ce qui lui est supérieur (la médiane 
donc par anticipation). 

e'(x) est donc une fonction affine (assimilable à l'équation d'une droite pour r et n fixés) par morceaux 
(discrète) où l'on peut assimiler le facteur: 


2 r-n (7.11) 


à la pente et: 


( * r+1 +...+ *„)-(*!+* 2 +...+ * r ) ( 7 . 12 ) 


à l'ordonnée à l'origine. 

La fonction est donc décroissante (pente négative) tant que r est inférieur à ni 2 et croissante quand r 
est supérieur à n/2. Plus précisément, nous distinguons deux cas qui nous intéressent particulièrement 
puisque n est un entier (elle pas donc par un extremum!): 

- Si n est pair, nous pouvons poser n = 2n ', alors la pente peut s'écrire 2{r - n ') et elle est nulle si 

r = n 1 et dès lors puisque ce résultat n'est valable par construction que pour Vx e [x r , x r+1 ] alors s '(x) 
est constante sur [ x„., x„. +1 ] et nous avons un extrémum obligatoirement au milieu de cet intervalle 
(moyenne arithmétique des deux termes). 

- Si n est impair, nous pouvons poser « = 2n '+1 (nous coupons la série en deux parties égales), alors la 
pente peut s'écrire (2 r - 2n '— 1) et elle est donc nulle si r = n '+1/ 2 et dès lors puisque ce résultat n'est 
valable que pour Vx e [i r ,^ +1 ] alors il est immédiat que la valeur du milieu sera la médiane x H . +1 . 

Nous retrouvons donc bien la médiane dans les deux cas. Nous verrons aussi plus loin comment la 
médiane est définie pour une variable aléatoire continue. 

Il existe un autre cas pratique où le statisticien n'a à sa disposition que des valeurs regroupées sous 
forme d'intervalles de classes statistiques. La procédure pour déterminer la médiane est alors différente: 

Lorsque nous avons à notre disposition uniquement une variable classée, l'abscisse du point de la 
médiane se situe en général à l'intérieur d'une classe. Pour obtenir alors une valeur plus précise de la 
médiane, nous procédons à une interpolation linéaire. C'est ce que nous appelons la "méthode 
d'interpolation linéaire de la médiane". 

La valeur de la médiane peut être lue sur le graphique ou calculée analytiquement. Effectivement, 
considérons le graphique représentant la probabilité cumulée F(x) en intervalles de classe comme 
ci-dessous où les bornes des intervalles ont été reliées par des droites: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


299/4839 






Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 



Figure: 7.1- Représentation graphique de l'estimation par interpolation linéaire de la médiane 

La valeur de la médiane M se trouve évidemment au croisement entre la probabilité de 50% (0.5) et 
l'abscisse. Si nous prenons dans le cadre particulier de l'exemple ci-dessus la borne supérieure de 
l'intervalle de classe précédant celle contenant la médiane nous avons 2 et 4 pour la borne inférieure de 
l'intervalle suivant. Nous avons alors en calculant la pente la relation suivante: 


A*_ M -2 _ 4-2 

Ity- 0.5- 0.2 ~ 0.7- 0.2 


Ce que nous écrivons fréquemment: 


M e - a b-a 

0.5-F(a) ~ F (h)-F (a) 


(7.14) 


d'où la valeur de la médiane: 


„ ,, v 0 .5-F(a) 

M = a + (b - a) -( 7 . 15 ) 

s ' } F{b)-F{a) 

Prenons le tableau suivant que nous retrouverons bien plus tard dans le présent chapitre: 


Montant des 

tickets 

Nombre de tickets 

Nombre cumulés de 

tickets 

Fréquences 
relatives cumulées 

[0,50[ 

668 

668 

0.068 

[50,100[ 

919 

l'587 

0.1587 

[100,150[ 

l'498 

3'085 

0.3085 

[150,200[ 

l'915 

5'000 

0.5000 

[200,250[ 

1 ’915 

6'915 

0.6915 

[250,300[ 

l'498 

8'413 

0.8413 

[300,350[ 

919 

9'332 

0.9332 

[350,400[ 

440 

9772 

0.9772 

[400 et + 

228 

ÎO'OOO 

1 


Tableau: 7.2 - Identification de la classe médiane et du mode 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


300/4839 



































Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

Nous voyons que la "classe médiane" est dans l'intervalle [150,200] car la valeur cumulée de 0.5 s'y 
trouve (colonne toute à droite) mais la médiane a elle, en utilisant la relation établie précédemment, 
précisément une valeur de (c'est trivial dans l'exemple particulier du tableau ci-dessus mais faisons 
quand même le calcul...): 


M =150+ (200-150) - ° 5 °' 3085 = 200 (7.16) 

0.5-0.3085 

et nous pouvons faire de même avec n'importe quel autre centile bien évidemment! 

Nous pouvons également donner une définition pour déterminer la valeur modale si nous sommes 
seulement en possession des fréquences des classes d'intervalles. Pour cela partons du diagramme en 
barre des fréquences simplifié ci-dessous: 



Figure: 7.2 - Représentation graphique de l'estimation par classess d'intervalles de la valeur modale 

En utilisant les relations de Thalès (cf. chapitre de Géométrie Euclidienne), nous avons immédiatement, 
en notant M la valeur modale: 


M-% 

A l 



(7.17) 


Comme dans une proportion, on ne change pas la valeur du rapport en additionnant les numérateurs et 
en additionnant les dénominateurs, il vient: 


Nous avons alors: 


Aj À 2 Aj +A 2 


(7.18) 


M = x, + - 


Ai + A 2 


Ov+i - * ) 


(7.19) 


Avec l'exemple précédent cela donne alors: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


301/4839 























Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


M = 150 + - 


(1 1 915 — 1 '493) 


(1'915 — 1 1 498) + (1'915 — 1 '498) 


(250-150) 


= 150 + -1(250 -150) = 150 H- -IlOO = 200 


(7.20) 


La question qui se pose ensuite est celle de la pertinence du choix de la moyenne, du mode ou de la 
médiane en termes de communication... 


Un bon exemple reste celui du marché du travail où de façon générale, alors que le salaire moyen et le 
salaire médian sont relativement différents, les institutions de statistiques étatiques calculent la médiane 
que beaucoup de médias traditionnels assimilent alors explicitement au concept de "moyenne 
arithmétique" dans leurs communiqués. 


Remarque: Pour éviter d'obtenir une moyenne arithmétique ayant peu de sens, nous calculons 
souvent une "moyenne élaguée", c'est à dire une moyenne arithmétique calculée après avoir enlevé 
des valeurs aberrantes à la série. 


Les "quantiles" généralisent la notion de médiane en coupant la distribution en des ensembles donnés 
de parties égales (de même cardinal pourrions-nous dire...) ou autrement dit en intervalles réguliers. 
Nous définissons ainsi les "quartiles", les "déciles" et les "centiles" (ou "percentiles") sur la population, 
ordonnée dans l'ordre croissant, que nous divisons en 4, 10 ou 100 parties de même effectif. 

Nous parlerons ainsi du centile 90 pour indiquer la valeur séparant les premiers 90% de la population 
des 10% restants. 

Précisons que dans la version francophone de Microsoft Excel 11.8346 les fonctions QUARTILE( ), 
CENTILE( ), MEDIANE( ), RANG.POURCENTAGE ( ) sont disponibles et spécifions qu'il existe 
plusieurs variantes de calcul de ces centiles d'où une variation possible entre les résultats sur différents 
logiciels. 

Ce concept est très important dans le cadre des intervalles de confiance que nous verrons beaucoup 
plus loin dans ce chapitre et très utile dans le domaine de la qualité avec l'utilisation des boîtes à 
moustaches (traduction de Box & Whiskers Plot ou BoxPlot) permettant de comparer ("discriminer" 
comme disent les spécialistes) rapidement deux populations de données ou plus et surtout d'éliminer les 
valeurs aberrantes (prendre comme référence la médiane sera justement plus judicieux!): 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


302/4839 













Figure: 7.3 - Box & Whiskers Plot 

Une autre représentation mentale très importante des boîtes à moustache est la suivante (elle permet 
donc de se donner une idée de l'asymétrie de la distribution): 


Mode 



Qi M Qi 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


303/4839 




































Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


Mode Mode 


i-.|_ \_\-\ h U _ 1. 1 

Q\ M Q3 Q\ M Q3 

Figure: 7.4 - Représentation graphique du mode, de la médiane et des quartiles par rapport à une distribution 

Les notions de médiane, valeurs aberrantes et intervalles de confiance que nous venons de démontrer 
et/ou de citer sont à ce point importantes qu'il existe des normes internationales pour les utiliser 
correctement. Citons d'abord la norme ISO 16269-7:2001 Médiane - Estimation et intervalles de 
confiance et aussi la norme ISO 16269-4:2010 Détection et traitement des valeurs aberrantes. 

D3. Par analogie avec la médiane, nous définissons la "médiale" comme étant la valeur (dans l'ordre 
croissant des valeurs) qui partage la somme (cumuls) des valeurs en deux masses égales (donc la 
somme totale divisée par deux). 

Dans le cas de salaires, alors que le médiane donne le 50% des salaires se trouvant en-dessous et 
en-dessus, la médiale donne combien de salariés se partagent (et donc le salaire partageant) la première 
moitié et combien de salariés se partagent la seconde moitié de l'ensemble des coûts salariaux. 




[Vincent ISOZ] | http://www.sciences.ch] | Page: 


304/4839 































Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

Par exemple pour revenir à notre tableau sur les salaires: 


|N 0 Employé 

Salaire 

Cumul salaire 

%Cumulé salaire 

i 

1200 

1200 

3.5% 

2 

1220 

2420 

7% 

3 

1250 

3670 

10.7% 

4 

1300 

4970 

14.5% 

5 

1350 

6320 

18.4% 

6 

1450 

7770 

22.6% 

7 

1450 

9220 

26.8% 

8 

1560 

10780 

31.4% 

9 

1600 

12380 

36.1% 

10 

1800 

14180 

41.3% 

11 

1900 

16080 

46.8% 

12 

2150 

18230 

53.1% 

13 

2310 

20540 

59.8% 

14 

2600 

23140 

67.4% 

15 

3000 

26140 

76.1% 

16 

3400 

29540 

86% 

17 

4800 

34340 

100% 


Tableau: 7.3 - Identification de la médiale 


La somme de tous les salaires fait donc 34340 et la médiale est alors 17170 (entre l'employé n°ll et 
12) alors que la médiane était de 1*600. Nous voyons alors que la médiale correspond au 50% du 
cumul. Ce qui est un indicateur très utile dans le cadre des analyses de Pareto ou de Lorenz par 
exemple (cf. chapitre de Technique de Gestion). 

D4. La "moyenne quadratique" parfois simplement notée Q qui est définie par: 



H 

II 

2 >: 

M 


n 


(7.21) 


avec m= 2. 


Remarque : C'est une des moyennes les plus connues en statistiques car l'écart-type est une 
moyenne quadratique (voir plus loin). 


Exemple: 

Soit un carré de côté a, et un autre carré de côté b. La moyenne des aires des deux carrés est égale à un 
carré de côté: 




2 


2 , ,2 

a +b 


/C = 



+ b 2 
2 


(7.22) 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


305/4839 

















































































































Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

D5. La "moyenne harmonique" parfois simplement notée H est définie par: 




H 

Z ^" 1 


« 


(7.23) 


Elle est peu connue mais découle souvent de raisonnements simples et pertinents (typiquement la 
résistance équivalente d'un circuit électrique ayant plusieurs résistances en parallèles). Il existe une 
fonction MOYENNE.HARMONIQUE( ) dans Microsoft Excel 11.8346 (version française) pour la 
calculer. 


Exemple: 

Soit une distance d parcourue dans un sens à la vitesse v Y et dans l'autre (ou pas) à la vitesse v 2 . La 
vitesse moyenne s'obtiendra en divisant la distance totale 2 d par le temps mis à la parcourir: 

2 d 

V =- (7.24) 

t 

Si nous calculons le temps mis lorsqu'on parcourt d avec une vitesse v s c'est tout simplement le 
quotient: 


d 

(7.25) 


Le temps total vaut donc: 


t 



(7.26) 


La vitesse moyenne (son inverse pour être exact) sera donc bien du type harmonique: 


1 

v 


' d 

d 1 

1 

fl 

il 

— + — 

= — 

- + - 

l v l 

V 2 

J J 

2 

l v i 

V 2 


(7.27) 


D6. La "moyenne géométrique" parfois notée simplement G est définie par: 



(7.28) 


Cette moyenne est souvent oubliée mais néanmoins très connue dans le domaine de l'économétrie 
(surtout quand nous étudierons le rendement géométrique moyen) et de la finance d'entreprise (cf. 
chapitre Techniques De Gestion) raison pour laquelle il existe une fonction 

MOYENNE.GEOMETRIQUE( ) dans Microsoft Excel 11.8346 (version française) pour la calculer. 


Exemple: 

Supposons qu'une banque offre une possibilité de placement et prévoit pour la première année un 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


306/4839 














Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

intérêt (c'est absurde mais c'est un exemple) avec un taux (X - ¥)% , mais pour la deuxième année un 
intérêt avec un taux (X + Y)% Au même moment une autre banque offre un intérêt à taux constant 
pour deux ans: X%. C'est pareil, dirons-nous un peu rapidement. En fait les deux placements n'ont pas 
la même rentabilité. 

Dans la première banque, un capital C 0 donnera au bout de la première année un intérêt: 

(X~Y)%'C 0 (7.29) 


et la seconde année: 


(X + Y)% [(Z - Y)% ■ C 0 ] (7.30) 

Dans l'autre banque nous aurons au bout d'un an: 

X% ■ C 0 (7.31) 


et après la seconde année: 


X% (X%C 0 ) (7.32) 


etc... 

Comme vous pouvez le voir le placement ne sera pas identique si Y * 0 ! X% n'est donc pas la 
moyenne de (X - Y)% et (.X + Y)% . 

Posons maintenant: 


^ = (X + Y)% et r a =(X- Y)% (7.33) 

Quelle est en fait la valeur moyenne r ? 

Au bout de deux ans le capital est multiplié par ^ ■ r 2 . Si la moyenne vaut r il sera alors multiplié par r 2 
. Nous avons donc la relation: 


r 2 =r 1 -r 2 r = ,/q ■ r 2 (7.34) 


C'est un exemple d'application où nous retrouvons donc la moyenne géométrique. L'oubli de la 
moyenne harmonique une erreur fréquente dans les entreprises lorsque certains employés calculent le 
taux moyen d'augmentation d'une valeur de référence. 


D7. La "moyenne mobile", appelée aussi "moyenne glissante" est définie par: 


MM, = 


M 1 +M 2 +... +M S 
n 


(7.35) 


La moyenne mobile est particulièrement utilisée en économie, où elle permet de représenter une courbe 
de tendance d'une série de valeurs, dont le nombre de points est égal au nombre total de points de la 
série de valeurs moins le nombre que vous spécifiez pour la période. 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


307/4839 









Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

Une Moyenne Mobile (MM) en finance est calculée à partir des moyennes des cours d'une valeur, sur 
une période donnée: chaque point d'une moyenne mobile sur 100 séances est la moyenne des 100 
derniers cours de la valeur considérée. Cette courbe, affichée simultanément avec la courbe d'évolution 
des cours de la valeur, permet de lisser les variations journalières de la valeur, et de dégager des 
tendances. 

Les moyennes mobiles peuvent être calculées sur différentes périodes, ce qui permet de dégager des 
tendances à court terme MMC (20 séances selon les habitudes de la branche), moyen terme (50-100 
séances) ou long terme MML (plus de 100 séances). 



Figure: 7.5 - Représentation graphique des quelques moyennes mobiles pour 100 séances de négoce 


Les croisements des moyennes mobiles par la courbe des cours (découpée avec une certaine 
granularité) de la valeur génèrent des signaux d'achat ou de vente (selon les professionnels) suivant le 
cas: 

- Signal d'achat: lorsque la courbe des cours franchit la MM. 

- Signal de vente: lorsque la courbe des cours franchit la MM vers le bas. 

Outre la moyenne mobile, précisons qu'il existe une quantité d'autres indicateurs artificiels souvent 
utilisés en finance comme par exemple le "upside/downside ratio". 

L'idée est la suivante: Si vous avez un produit financier (cf. chapitre d'Économie) actuellement de prix 
P e (prix courant) pour lequel vous avez un objectif de gain haut à un prix haut correspondant que nous 

noterons P h (high price) et inversement le potentiel de perte que vous estimez à un prix P x (low price). 


Alors, le rapport: 


3~3 

3-3 


= ud r 


(7.36) 


donne le Upside/Downside Ratio. 

Par exemple, un produit financier de 10.- avec un prix bas de 5.- et un prix haut de 15.- a donc un ratio 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


308/4839 
























































































































Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

UD R = 1 et donc un facteur spéculatif identique pour permettre le gain ou une perte de 5.-. 

Un produit financier de 10.- avec un prix bas de 5.- et un prix haut de 20.- a donc un UD R = 2 donc 
deux fois le potentiel spéculatif de gain par rapport à celui de perte. 

Certaines associations boursières recommandent de refuser les UD R inférieurs à 3. Les investisseurs 
ont tendance à rejeter les UD R trop élevés pouvant être un signe de gonflage artificiel. 


D8. La "moyenne pondérée" (dont nous avons déjà fait mention plus haut d'un cas particulier) est 
définie par: 



(7.37) 


et est utilisée par exemple en géométrie pour localiser le barycentre d'un polygone, en physique pour 
déterminer le centre de gravité ou en statistiques pour calculer une espérance (le dénominateur étant 
toujours égal à l'unité en probabilités) et en gestion de projets pour estimer les durées des tâches. 

Dans le cas général le poids p i représente l'influence pondérée ou arbitraire/empirique de l'élément x i 
par rapport aux autres. 


D9. La "moyenne fonctionnelle" ou "moyenne intégrale" est définie par: 




(7.38) 


où fij dépend d'une fonction/ d'une variable réelle intégrable (cf. chapitre de Calcul Différentiel Et 

Intégral) sur un intervalle \a,b\. Elle est très souvent utilisée en théorie du signal (électronique, 
é lectrotechnique). 


2.1. LISSAGE DE LAPLACE 


Pour en revenir à nos fréquences de classes vues bien plus haut et avant de continuer avec l'étude de 
quelques propriétés mathématiques des moyennes... il faut savoir que lorsque nous travaillons avec des 
lois discrètes de probabilités il arrive très (très) fréquemment que nous rencontrions un problème 
typique dont la source est la taille de la population. Considérons comme exemple le cas où nous avons 
12 documents et que souhaiterions estimer la probabilité d'occurrence du mot "Viagra". Nous avons sur 
un échantillon les valeurs suivantes: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


309/4839 











Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


[identifiant document 

[Occurrences du mot 

1 

1 

2 

0 

3 

2 

4 

0 

5 

4 

6 

6 

7 

3 

8 

0 

9 

6 

10 

2 

11 

0 

12 

1 


Tableau: 7.4 - Fréquences de classe du mot 


Tableau que nous pouvons représenter d'une autre manière: 


Occurrences du mot 

Documents 

Probabilité 

0 

4 

0.33 

1 

2 

0.17 

2 

2 

0.17 

3 

1 

0.083 

4 

1 

0.083 

5 

0 

0 

6 

2 

0.17 


Tableau: 7.5 - Fréquences de classe respective des documents 


Et ici nous avons un phénomène courant. Il n'y a aucun document avec 5 occurrences du mot qui nous 
intéresse. L'idée (très courante dans le domaine du Data Mining) est alors d'ajouter artificiellement et 
empiriquement un comptage en utilisant une technique appelée "lissage de Laplace" qui consiste à 
additionner k unités à chaque occurrence et qui est courant dans le domaine du Data Mining. Dès lors le 
tableau devient: 


Occurrences du mot 

Documents 

Probabilité 

0 

5 

0.26 

1 

3 

0.16 

2 

3 

0.16 

3 

2 

0.11 

4 

2 

0.11 

5 

1 

0.05 

6 

3 

0.16 


Tableau: 7.6 - Fréqunce de classe des documents avec lissage 


Évidemment ce type de technique est sujet à débat et sort du cadre scientifique... Nous avons même 
hésité à présenter cette technique dans le chapitre de Méthodes Numériques (avec le reste de toutes les 
techniques numériques empiriques)... 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


310/4839 













































































































Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

2,2. PROPRIÉTÉS DES MOYENNES 


Voyons maintenant quelques propriétés pertinentes qui relient quelques-unes de ces moyennes ou qui 
sont propres à une moyenne donnée. 

Les premières propriétés sont importantes donc prenez garde à bien les comprendre: 

PI. Le calcul des moyennes arithmétique, quadratique et harmonique peut être généralisé à l'aide de la 
relation suivante: 



(7.39) 


où nous retrouvons: 

1. Pour m = 1, la moyenne arithmétique 

2. Pour m = 2, la moyenne quadratique 

3. Pour m = -1, la moyenne harmonique 

P2. La moyenne arithmétique a une propriété de linéarité, c'est-à-dire que (sans démonstration car 
simple à vérifier): 


Ax + ju = Ax + ià 


(7.40) 


C'est la version statistique de la propriété de l'espérance en probabilité que nous verrons plus loin. 
P3. La somme pondérée des écarts à la moyenne arithmétique est nulle. 

Démonstration: 

D'abord, par définition, nous savons que: 


n = 


Y/h et A 


2-1 


1 

n 



(7.41) 


il s'ensuit que: 


Y^ (*f "/O = Y n i X i ~ ^Y n i = Y n i X i ~ 


1 


2-1 


i-1 


2-1 


2 J. 


-Y*** \ n = Y n ^ ~Y^ x i = 0 

»1T J w w 


(7.42) 


2-1 


2-1 


Ainsi, cet outil ne peut être utilisé comme mesure de dispersion! 

Par extension la moyenne des écarts à la moyenne pondérée par les effectifs est nulle aussi: 


r 

'Zflh-P) ,7.43) 

-= o 

« 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


311/4839 














Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

□C.Q.F.D. 

Ce résultat est relativement important car il permettra plus loin de mieux saisir le concept d'écart-type 
et de variance. 

P4. Soit à démontrer: 


Ai < A* < A tt < A, (7-44) 


Démonstration: 


Tout d'abord, nous prenons deux nombres réels non nuis x 1 et x 2 tels que x 2 > x x > 0 et nous écrivons: 

1. La moyenne arithmétique: 


A, 


= Xl - (7.45) 


2. La moyenne géométrique: 


3. La moyenne harmonique: 


M g = 4*1*2 ( 7 - 46 ) 


1 1 

- + - 

l _ X 1 x 2 


*2 x *1 


* 1*3 * 1*2 _ *1 + *2 


Ai ^ 

4. La moyenne quadratique: 


4^ Ai 


(7.47) 


2 2x 1 x a ' " Xj + x 2 


2 *1 + *2 


(7.48) 


Remarque : Les comparaisons entre les moyennes précitées et la médiane ou encore les moyennes 
glissantes et pondérées n'ont pas de sens c'est pour cela que nous nous abstenons à les faire. 


Prouvons déjà que fx > fx h par l'absurde en posant fx g - fx k < 0 : 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


312/4839 
























Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


„ „ _ /TT" 2 *1*2 _ V^*2*l+V*ï^*2- 2 *1*2 

Pg h ~ V^i *2 7 - 7 ' u 


*1 + *2 


*1 +*2 


■ X 1 + 4 * 1*2 *2 ~ 2 * 1*2 < 0 
■ 44 * 2*1 + 4 * 1*2 *2 < 2 * 1*2 
4 * ï *2 4 * 1*2 


-+■ 


<2 


(7.49) 


A + lïl <2 


Par commodité posons y = j— nous savons que y > 1. Or: 

' *1 



(7.50) 


et nous cherchons à montrer que ph + I— < 2 n’est pas possible. Mais ceci découle des 


équivalences suivantes: 


2 

^ <2^y 2 + \-2y < 0 » -1) 2 <0 (7.51) 




*1 y 


Il y a donc contradiction ce qui vérifie notre hypothèse initiale: 

f* s > 0 ^ ,U S > (7.52) 


Regardons maintenant si /4 > [Â g : 

Sous l’hypothèse x 2 > Vj > 0. Nous cherchons donc maintenant à montrer que: 


*1 + *2 

2 


> 4*1 ■ *2 


(7.53) 


Or nous avons les équivalences suivantes: 

> 4 * 4*2 <=>(*1 +* 2) 2 > 4 *1 • *2 <=> * 1 2 +*2 - 2 *1 *2 > 0 <^> (*1 - X 2 f > 0 ( 7 - 54 ) 

et la dernière expression est évidement correcte. 

Or le carré d’un nombre est toujours positif ce qui vérifie notre hypothèse initiale: 

-/^ÛO (7.55) 

Nous prouvons maintenant jJ q > /4 et démontrons-le par l’absurde en posant j.i q - /4 < 0 : 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


313/4839 






















Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


M a ~ Ma = 


U \ + *2 *1 + *2 


U\+Â *1 +*2 


<0 


2,2 . 2,2 2 , 0 .2 
| *1 + *2 .. *1 +*2 P + *2 . *1 + 2*1 *2 + *2 (7.56) 


2 2 X? + 2 Xi X? +Xn 2 

*1 +*2 <-- H -~ 


Xi - 2x l x 2 + x 2 < o => - x 2 y <0 


Or le carré d'un nombre est toujours positif ce qui vérifie notre hypothèse initiale: 

A - M a > 0 W u > (7.57) 


Nous avons donc bien: 


Mk < A, < < M* (7.58) 


□C.Q.F.D. 

Ces inégalités démontrées, nous pouvons alors passer à une figure que nous attribuons à Archimède 
pour placer trois de ces moyennes. L'intérêt de cet exemple est de montrer qu'il existe des relations 
remarquables parfois entre la statistique et la géométrie (fruit du hasard ???). 



Figure: 7.6 - Point de départ pour la représentation géométrique des moyennes 

Nous allons d'abord poser a = ~KÈ, b = ~BC et O est le milieu de ÿjjÿ . Ainsi, le cercle dessiné Q est de 
centre O et de rayon qJ . D est l'intersection de la perpendiculaire à passant par B et du cercle Q 
(nous choisissons l'intersection que nous voulons). H est quant à lui le projeté orthogonal de B sur qq . 

Archimède affirme que q est la moyenne arithmétique de a et Z) et que ]Ï£) est la moyenne 
géométrique de a et b, et QH la moyenne harmonique de a et b. 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


314/4839 
























Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

Nous démontrons donc que (trivial): 


OA 


AC 

2 


a +b 
2 


(7.59) 


Donc qâ est bien la moyenne arithmétique u a de a et b. 

Ensuite nous avons dans le triangle rectangle ADB: 

AD 2 = DB 2 + BÂ 2 (7.60) 

Puis dans le triangle rectangle BDC nous avons: 

DC 2 =BC 2 + DB 2 (7-61) 

Nous additionnons alors ces deux égalités, et nous trouvons: 

2 DB 2 + RÀ 2 + BC 2 = AD 2 + DC 2 (7-62) 

Nous savons que D est sur un cercle de diamètre Âç > donc ADC est rectangle en D, donc: 


AD 2 + DC 2 = AC 2 (7-63) 

Puis nous remplaçons ~ba et BC P ar a et b\ 

2 DB 2 + a 2 +b 2 =AC 2 = (a + b) 2 & 2DB 2 = 2ab ~DB = -Job (7.64) 
Et donc, est bien la moyenne géométrique fi de a et b. 

Nous reste à prouver alors que qJ{ est la moyenne harmonique de a et b: 

Nous avons dans un premier temps (projection orthogonale): 

-— — ,-(a + M — 

DO o DB = DO • I DB cos a I = DO • DH = - DH (7.65) 


Puis nous avons aussi (projection orthogonale aussi): 


DO o DB = {DO co s a.) ■ DB = DB ■ DB = DB ( 7 - 66 ) 


Nous avons donc: 


DB 2 = 


fa + b' 


DH (7.67) 


et comme DB = -Jâb ■> nous avons donc: 


DH = (7.68) 

a +b 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


315/4839 

















Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

nji est donc bien la moyenne harmonique de a et b, Archimède ne s'était pas trompé. 

3. TYPES DE VARIABLES 


Lorsque nous avons parlé des échantillons au début de ce chapitre, nous avons fait mention de deux 
types d'informations: les variables quantitatives et qualitatives. Nous n'avons cependant pas précisé qu'il 
existait trois types de variables quantitatives très importantes qu'il convient absolument de différencier: 

1. Les variables discrètes (par comptage): Sont analysées avec des lois statistiques basées sur un 
domaine de définition dénombrable toujours strictement positif (loi de Poisson typiquement dans 
l'industrie). Sont quasiment toujours représentées sous forme graphique par des histogrammes. 

2. Les variables continues (par mesure): Sont analysées avec des lois statistiques basées sur un domaine 
de définition non dénombrable strictement positif ou pouvant prendre toute valeur positive ou négative 
(loi Normale typiquement dans l'industrie). Sont également quasiment toujours représentées sous forme 
graphique par des histogrammes avec des intervalles de classe. 

3. Les variables par attribut (de classification): Il ne s'agit pas de données numériques mais de données 
qualitatives de type {Oui, Non}, {Réussi, Échec}, {A temps, En retard}, etc. Les données de type 
attribut suivent une loi Binomiale. 

Comprendre les différents types de données est une discipline importante de l'ingénieur parce que cela 
a des conséquences importantes sur le type d'analyse, les outils et techniques qui seront employés. 

Une question fréquente concernant la collecte de données est de savoir quelle est la quantité qui devrait 
être collectée. Au fait cela dépend du niveau de précision souhaité. Nous verrons beaucoup plus loin 
dans ce chapitre (avec démonstration) comment déterminer mathématiquement la quantité de données 
à collecter en parlant de la précision souhaitée pour un process Normal. 

Voyons de près de quoi il s'agit car maintenant que le concept de moyenne nous est relativement bien 
connu, nous allons pouvoir aborder des calculs plus formels et qui prendront tout leur sens. 

3.1. VARIABLES DISCRÈTES 


Soit X une variable indépendante (un individu d'un échantillon dont la propriété est indépendante des 
autres individus) qui peut prendre les valeurs aléatoires discrètes x 1 , x 2 , x 3 ,... dans M (réalisations du 

vecteur [Zj,Zj X n 0 avec les probabilités respectives p l ,p 2 ,p l ,... où, de par l'axiomatique des 
probabilités: 


Pi e [ 0.1] Z Pi = 1 (7.69) 

i 


Définitions: 

Dl. Soit Aune variable aléatoire (v.a.) numérique (quantitative). Elle est complètement décrite par la 
valeur de la probabilité (pour les variables discrètes) ou par la probabilité cumulée (pour les variables 
continues) pour qu'une réalisation de cette variable soit inférieure à x pour tout x. Cette probabilité 
(cumulée) est notée: 


F(x) = P(X<x) Vxeffi (7.70) 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


316/4839 









Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


avec: 


i>p(jr)>o (7.7i) 

où F(x ) s'appelle la "fonction de répartition" de la variable X. C'est la proportion théorique de la 
population considérée dont la valeur est inférieure ou égale à x. Il s'ensuit: 

Pi X > x> = l-F(x) ^PyX <x \ + P[ X > xi = l (7.72) 

Plus généralement, pour toute paire de nombres a et b avec a <b , nous avons: 

P< a < X < b ' = F (b) - F (a) (7.73) 

D2. La "fonction de répartition empirique" est quant à elle définie naturellement par (nous avons 
indiqué les différentes notations courantes dans la littérature): 


- 1 ” 1 ” #iî : Xj < xi 


]=1 


« 


2=1 




e [ûj] 


associé à l'échantillon de variables aléatoires indépendantes et identiquement distribuées (ce que l'on 
nomme aussi un "vecteur aléatoire" noté [ X±, X 2 ,..., X n 1 ). 

Il s'agit simplement du cumul normalisé à l'unité des fréquences d'apparition en-dessous d'un certaine 
valeur fixée (démarche que la majorité des êtres humains font naturellement en cherchant la fonction 
de répartition). 

Donc si nous reprenons l'exemple s de salaires, vus plus haut, nous avons alors par exemple pour x fixé 
à l’800: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


317/4839 







Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


Salaires ordonnés 

Fréquence 

IA 

1-L 

JM 

IA 

1200 

l 

1220 

l 

1250 

l 

1300 

l 

1350 

l 

1450 

l 

1450 

l 

1560 

l 

1600 

l 

1800 

l 

1900 

0 

2150 

0 

2310 

0 

2600 

0 

3000 

0 

3400 

0 

4800 

0 


Figure: 7.7 - Exemple de la fonction de répartition empirique 


et donc: 


1 17 1 

F \ 7 ix <l'800i= — = —10 = 59% (7.75) 

1 / 17 _, ^ 17 

La fonction de répartition est clairement une fonction monotone croissante (ou plus précisément "non 
décroissante") dont les valeurs vont de 0 à 1. 

3.1.1. ESPÉRANCE ET VARIANCE DE VA. DISCRÈTES 

Définition: Nous définissons "l'espérance mathématique", appelée aussi "moment d'ordre 1", de la 
variable X par la relation: 


ix x =E{X) =^ J Pi x i 

i 


(7.76) 


appelée aussi "règle des parties". 

En d'autres termes, nous savons qu'à chaque événement de l'espace des échantillons est associé une 
probabilité à laquelle nous associons également une valeur (donnée par la variable aléatoire). La 
question étant alors de savoir quelle valeur, à long terme, nous pouvons obtenir. La valeur espérée, 
(l'espérance mathématique donc...) est alors la moyenne pondérée, par la probabilité, de toutes les 
valeurs des événements de l'espace des échantillons. 

Si la probabilité est donnée par une fonction de distribution (voir les définitions des fonctions de 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


318/4839 


























Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

distribution plus bas) de la variable aléatoire, nous avons: 

Pi = /(*i) => Px = S(X ') = ( 7 - 77 ) 


Remarques : 

RL j.i x peut être notée A s'il n'y pas de confusion possible. 

R2. Si nous considérons chaque valeur x l ,x 2 ,x- s> ... comme les composantes d'un vecteur x et 
chaque probabilité (ou pondération) p 1 , p 2 , p $,... comme les composantes d'un vecteur p alors 

nous pouvons écrire l'espérance de manière technique sous la forme d'un produit scalaire souvent 
noté: 

71 

p°x = {p,x) = Y J PiXi= E ( X ) (7.78) 

2=1 


Voici les propriétés mathématiques les plus importantes de l'espérance pour toute variable aléatoire 
(quelle que soit sa loi!) ou pour toute série de variables aléatoires et que nous utiliserons souvent tout 
au long de ce chapitre: 

PI. Multiplication par une constante: 

E(aX) = Yjxxi p ( x = v) = x ( ) =aE{X) (7 79) 

Z Z 

P2. Somme de deux variables aléatoires: 


E{X+Y) = 2 [te +y i ) E {( x = *>) n (Y = yj)) 

ij 

=2 [v ((-*■=* ) " <7 = y, ) )]+Z [y j p ((■ « =* )• ^ <7 = y, ) )] 

U J b J 

{ \ ( 

= 2* S^(c^ = ^)n(r=^.)) +2^- Z p [( x = ^ r '( Y =y J )) 


\ J 
/ 


J V 
/ 


(7.80) 


= 2** p ( X =x i )r*{j<r=y j ) +2 y } p <X=yj)r*{J(X=x i ) 

2 J J 2 ' 

= 2 = *.-) ■+ 2 ^ ■ p { Y = yj) = s ( x )+ 


où nous avons utilisé dans la 4ème ligne, la propriété vue dans le chapitre de Probabilités: 


U 4 -2>4 

^ZeN 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


319/4839 


















Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

Nous en déduisons que pour n variables aléatoires X i , définies sur une même loi de distribution: 


S 


Z* 


-][£««) (7.81) 


P3. Espérance d'une constante: 


£(<;*) = 5 /* 
2 


1 Pi 


=c t 



(7.82) 


Définition: Après avoir traduit la tendance par l'espérance il est intéressant de traduire la dispersion ou 
"déviation standard" autour de l'espérance par une valeur appelée "variance de X" ou encore "moment 
centré du deuxième ordre", notée V(X) ou cr x (lire "sigma-deux") et donnée sous sa forme discrète par: 


ai = V{X) = S [(JT - U X Ÿ] = ^,~Uxf Pi 


(7.83) 


La variance n'est cependant pas comparable directement à la moyenne, car l'unité de la variance est le 
carré de l'unité de la variable, ce qui découle directement de sa définition. Pour que l'indicateur de 
dispersion puisse être comparé aux paramètres de tendance centrale (moyenne, médiane et... mode), il 
suffit d'en prendre la racine carrée. 


Par commodité, nous définissons ainsi "l'écart-type" de X, noté c(X ), par: 


c(X)=c x =^V\X) 


(7.84) 


L'écart-type est donc la moyenne quadratique des écarts (ou "écart moyen quadratique") entre les 
observations et leur moyenne. 


Remarques : 

RI. L'écart-type c x de la variable aléatoire X peut être noté c s'il n'y pas de confusion possible. 

R2. L'écart-type et la variance sont, dans la littérature, souvent appelés "paramètres de dispersion" 
à l'opposé de la moyenne, mode et médiane qui sont appelés des "paramètres de position". 


Définition: Le rapport cl pi (exprimé en %) parfois utilisé dans les entreprises comme comparaison de 
la moyenne et de l'écart-type est appelée le "coefficient de variation" (C.V). 

Pourquoi trouvons-nous un carré (réciproquement une racine) dans cette définition de la variance? La 
raison intuitive est simple (la rigoureuse l'est nettement moins...). Nous avons démontré plus haut que la 
somme des écarts à la moyenne pondérés par les effectifs, est toujours nulle: 

r 

ZXC x i~v) = ® ( 7 - 85 > 

2-1 

Or, si nous assimilons les effectifs par la probabilité en normalisant ceux-ci par rapport à n , nous 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


320/4839 













Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

tombons sur une relation qui est la même que la variance à la différence que le terme entre parenthèse 
n'est pas au carré. Et nous voyons alors immédiatement le problème... la mesure de dispersion serait 
toujours nulle d'où la nécessité de porter cela au carré. 

Nous pourrions imaginer cependant d'utiliser la valeur absolue des écarts à la moyenne, mais pour un 
certain nombre de raisons que nous verrons plus loin lors de notre étude des estimateurs le choix de 
porter au carré s'impose assez naturellement. 

Signalons cependant quand même l'utilisation courante dans l'industrie deux autres indicateurs 
fréquents de la dispersion: 

- "L'écart absolu moyen" (moyenne des valeurs absolues des écarts à la moyenne): 


EM = 


Zh-d 


2=1 


N 


(7.86) 


qui est un indicateur élémentaire très utilisé lorsque nous ne souhaitons pas faire de l'inférence 
statistique sur une série de mesures. Cet écart peut être facilement calculé dans la version française 
Microsoft Excel 11.8346 à l'aide de la fonction ECART.MOYEN( ). 

- "La déviation absolue de la médiane" noté MAD (médiane des valeurs absolues des écarts à la 
médiane): 


MAD = M e i\X-M e {X )h 


(7.87) 


qui est considéré comme un indicateur plus robuste de la dispersion que ceux donnés par l'écart absolu 
moyen ou l'écart-type (malheureusement cet indicateur n'est pas intégré nativement dans les tableurs). 


Exemple: 

Considérons les mesures d'une variable aléatoire X: 


il,l,2,2,4,6,9' (7.88) 


dont la médiane vaut: 


M e (X) - M e (1,1,2,2,4,6,9) = 2 ( 7 - 89 ) 

Les déviations absolues par rapport à la médiane sont alors: 

\X-M e (X J = (1,1,0,0,2,4,7 I (7.90) 


Mis dans l'ordre croissant, nous avons alors: 

10,0,1,1,2,4,7: (7.91) 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


321/4839 









Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

où nous identifions la déviation absolue de la médiane vaut: 


MAD = M e ( 0,0,1,1,2,4,7) = 1 (7.92) 

Dans le cas où nous avons à disposition une série de mesures, nous pouvons estimer la valeur 
expérimentale de la moyenne (l'espérance) et de la variance des mesures par les estimateurs suivants (il 
s'agit simplement au fait de l'espérance et l'écart-type d'un échantillon dont les événements sont tous 
équiprobables) dont la notation est particulière: 


1 M 

et 


« M 


« i-i 


(7.93) 


Démonstration: 


U = E{X) = j 'ÿjpft = = u 

1-1 i-1 * « 1-1 


^ = E(X~E(X )) 2 =E[(X-VxŸ] = 'Z(x i -V x fp i =XU-^) 2 - ( 7 - 94 ) 

i-1 i-1 ^ 




□C.Q.F.D. 

Et démontrons un petite propriété bien sympathique comme quoi la moyenne arithmétique est un 
optimum de la somme des carrés des écarts. Effectivement, nous avons: 


T)i x i - a 1 =Y i xf - 2cï^]. x i + ne? (7.95) 


2=1 


2=1 


2=1 


et si nous cherchons a tel que la dérivée de l'expression ci-dessus est nulle: 


d 

da 


T], xf - 2cï^. x i + ne? 
(.2=1 2=1 


= 0 (7.96) 


alors a est un optimum. Nous avons alors: 


da 


n 


j { n 

Y, xf - 2 cFP. + ne? 


\ 2=1 


2=1 


- -2Y, Xj + 2 na - 0 (7.97) 

2=1 


soit après réarrangement et simplification élémentaire: 

1 H 

a = -Yx i (7.98) 

« 2=1 

Il s'agit donc bien de la moyenne arithmétique. Maintenant pour savoir s'il s'agit d'un extrema de type 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


322/4839 












Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

maximum ou minimum il suffit de faire la dérivée seconde et de voir que cela donne une constante 
positive (donc la dérivée première augement quand a augmente). Il s'agit alors d'un bien extrema de 
type minimum! ! ! 

Le terme de la somme se trouvant dans l'expression de la variance (écart-type) est appelée "somme des 
carrés des écarts à la moyenne". Nous l'appelons aussi la "somme des carrés totale", ou encore la 
"variation totale" dans le cadre de l'étude de l'ANOVA (voir la fin de ce chapitre). 


Remarque :Il est important que le lecteur comprenne que dans ce cas l'espérance se calcule 
simplement en utilisant la moyenne arithmétique! 


La variance peut également s'écrire sous la forme de la "relation de Huyghens" que nous réutiliserons 
plusieurs fois par la suite. Voyons de quoi il s'agit: 

v(X) = = ^ -VxŸfixù = “ 2 ^ + ^ 4 )/^) 

3 3 

= 2*2 /(^ ) “ (Xj ) + pi x Z'.f(Xj ) = S ( x i ) " ^x + (7.99) 

3 3 3 3 

-'LtifW-A-E(X 2 )-E(X) 2 

3 

Faisons maintenant un petit crochet relativement à un scénario fréquent générateur d'erreurs dans les 
entreprises lorsque plusieurs séries statistiques sont manipulées (cas très fréquent dans l'industrie ainsi 
que dans les assurances ou la finance). 

Considérons deux séries statistiques portant sur le même caractère: 

- (xj(x , n p ), effectif total n, moyenne x , écart-type cr, 

- effectif total m, moyenne ÿ , écart-type cr 

Nous noterons (z k ,r k ) la série statistique obtenue en regroupant les deux séries. Nous avons alors: 


z=^ 


1 p 1 * 

Y i. + V y. n—'ÿ'x.+r >s — ’T' y. 

^ ^ nJi+m ÿ ( 7 . 100 ) 


Z 

3=1 


3=1 


n + m 


n + m 


n + m 


Donc la moyenne des moyennes n’est pas égale à la moyenne globale (première erreur fréquente dans 
les entreprises) exceptée si les deux séries statistiques ont le même nombre d’effectifs! ! ! 


Concernant l’écart-type, rappelons d’abord que nous avons: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


323/4839 












Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


= -r—Z^-te ~ x ) 2 = -Z^U- ~ x f 


Z* 

i=l 


ï=1 


»i=l 


ta- U- - y? 

Z*% !=1 

z=l 


(7.101) 


.i= >2 v_ 


Ï=1 


Pour la suite, rappelons que nous avons démontré précédemment la relation de Huygens: 

* 


V(z) = + = Eiz 2 ) - Eizf = (7-102) 

k !=i 


Il vient alors: 


1 Æ 1 Æ 

= tZ W - = tZV? " 


k : =i 
1 * 


i=l 


f nx +my ^ 

1 

^ n + m j 

n + m 


_ fl 

2 „ ^ 2 


Z^ r v +Z ff w 
, 1=1 2=1 y 


nx + ray 
\ « + ra j 


i 15 


».-i 


-Z^' + «—Z"V* / _ , _ X 2 

!=1 f + my \ 

n + m \ n+m ) 

1 Z 2 -2 , 1 2 -2 


«7=1 


W3 !=1 ' ' «x 2 + my 2 f+/«y ) 2 


M + m 
\ 


-Z^v 7 ? -y 2 


\» i=l 


/ 




M + W3 V M+tfS 


^ 2,-2 / -. -\2 


n+m 

+mojj +xx 2 +mÿ 2 (nx+nÿ'Y 


■ + 


nx + my 
n + m 


nx +my 
n + m 


n + m 


n+m V n+m 


no^+mcÿ (nx 2 +my 2 'j(n + m)-(nx+my) 2 


n + m 


(n + mY 


ia^ +mo^ (n 2 x 2 +mny 2 +mnx 2 + m 2 y 2 J - ^« 2 ;r 2 + 2 nxmy + n?y 2 J 


n + m 


(n + m) 

îO^+mc$ (mnÿ 2 + mnx 2 J - (2 nxmÿ) naf + ma 2 y 


»+m (n + m) 

îO 2 +ma 2 ( x-ÿf 

— - *-+nm> } 


+ nm 


y 2 + x 2 — 2 xy 


n+m 


[n + my 


n + m 


( n+m'y 


(7.103) 


Donc nous voyons que l’écart-type global n’est pas égal à la somme des écarts-types (deuxième erreur 
courante dans les entreprises) excepté si les effectifs et les moyennes sont les mêmes dans les deux 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


324/4839 












































Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

séries!!! 


Considérons maintenant X une variable aléatoire d'espérance A (valeur constante et déterminée) et de 
variance a 2 (valeur constante et déterminée), nous définissons la "variable centrée réduite" par la 
relation: 


Y = 


x-t* 


c 


(7.104) 


et l'on démontre de façon très simple en utilisant la propriété de linéarité de l'espérance et la propriété 
de multiplication par un scalaire de la variance (voir de suite après) que: 

E(Y) = 0, V(Y) = 1 (7.105) 


Démonstration: 


E(Y) = E 


Izü 
& ) 


= Is(JT - A ) = I (*( X) - BW) = i(A- M- 5(1)) 


= 1 ( a - A '«( 1))=0 = Ak 


(7.106) 


et en utilisant la relation de Huyghens: 


V{Y) = E(Y 2 ) - = E(Y 2 ) = E [^{ x2 ~ ZXv+V 2 )j = 

= -L [E{X 2 )- 2E(X)m+M 2 ) = -Xr{E(X 2 )- 2/t 2 +/t 2 ) 

V{X) = \a 2 =1 


= ^|V(Z) + ^V) = ^ 


-Xr[E(X 2 )-2E(X)v+V 2 ) 


(7.107) 


□C.Q.F.D. 


Ainsi, toute répartition statistique définie par une moyenne et un écart-type peut être transformée en 
une autre distribution statistique souvent plus simple à analyser. 

Voici quelques propriétés mathématiques importantes de la variance: 

PI. Multiplication par une constante: 

V(nX) (7 .10S) 

3 3 

P2. Somme de deux variables aléatoires: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


325/4839 











Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


V(X+y) = 22 ((* + ^) ■- [Mx + Mv)) 2 /(w,) 

2 ' J 

= Z Z (C ■* - !*x) + (^- - )f /(* ’^ ) 

2 ' J 

= Z Z (( ■* - + 2C ■* - ft z ) -My)+ {y J ~ frf )/(% .y;) 

= Z {*i-Vxf f (*,-> y 3 ) + 2Z (X - Vx)(yj -Uy )/(a ,yj)+ Z(y,- -u? f f (*,-.t ? ) 








= +rao+ 2£ (x,- ft r )[yj - «■)/(*, .y,) 

Ui 

= r(^T) + V{Y) +2 E\[X-fi x ){Y -fity)] = V{X) + VÇT) + 2cov(JT,7) 


3.1.2. COVARIANCE DISCRÈTE 


(7.109) 


Nous venons de voir dans la dernière relation le concept de "covariance" dont nous verrons une 
expression plus commode un peu plus bas mais donc définie par: 


-iftx-Hz'Ar-M,)'] 


(7.110) 


Introduisons une forme plus générale et extrêmement importante de la covariance dans de nombreux 
domaines: 


V(X +Y + Z) = ZZZ((*1 + Yi + z ù~&x + +Az)) 2 /(Wj- 2 *) 

i j k 

= Z Z Z C (*ï - Vjt) + (yj - Vy) + (z k -Vz)f f(*i Xj, Z k ) 

2 J k 

= ZZZ(^ +5+c )V(w^0 

1 j k 

= ZZZ (a 2 +B 2 +C 2 + 2AB + 2BC + 2AC)f(x i ,y J .,z k ) 

2 j k 

= riX) + V(.r) + V(Z)+2'Z l Z l Z l (AB + BC + AC)f{x l .y j ,zà 

= V(X) + V(Y) + V(Z)+2 cov(JT, Y) + 2 cov(Y, Z)+2 covfjf, Z) 

= V(X\ ) + V(X 2 ) +V(X-,)+2 covU',, X 2 ) + 2 coï( JT 2 , X 3 ) + 2 cov( X t , JT 3 ) 

= 2^)+2Z“v(^.jr ; ) 

2=1 2'<J 


Donc dans le cas général: 



(7.112) 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


326/4839 











Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

En utilisant la propriété de linéarité de l'espérance et le fait que: 


E{X) = c u 
E(ç te ) = c te 


(7.113) 


nous avons pour la covariance: 

cov(A, Y) = E [( X- E{X))(Y - E(Y ))] = E[XY - E(X)Y - XE{Y) + E(X)E(Y )] 
= E(XY) - E(E(X)Y) - E(XE(Y)) + E(E(X)E(Y)) 

= E{XY) - E(X)E(Y) - E(Y)E (JT) + E(X)E(Y)E{ 1) 

= E(XY) -2 E(X)E(Y) + E(X)E(Y)E (1) = E(XY) -E(X)E(Y) 


et donc nous obtenons la relation très utilisée en statistiques et finance dans la pratique appelée 
"formule de la covariance"...: 


Cxj = cov(jr,r) = E{XY) - E{X)E{Y) 


(7.115) 


qui est cependant plus connue sous la forme: 


C I JT = C0V | I,1 , I = -y. - x ■ y ( 7 . 116 ) 

n 7 

Indiquons également que si X = Y , ce qui équivaut donc à une covariance univariée, nous retrouvons 
la relation de Huyghens: 


c x,x - B 1 ^ ) - - E [i Jf - 11 X - iâ% 'J - E 


x-vx^y^'X^o^ 


(7.117) 


Remarque : Les statistiques peuvent être découpées selon le nombre de variables aléatoires que 
nous étudions. Ainsi, lorsqu'une seule variable aléatoire est étudiée, nous parlons de "statistique 
univariée", pour deux variables aléatoires de "statistique bivariée" et en général, de "statistique 
multivariée". 


Si et seulement si les variables sont équiprobables, nous retrouvons la covariance dans la littérature 
sous la forme suivante, appelée parfois "covariance de Pearson", qui découle de calculs que nous avons 
déjà fait antérieurement avec l'espérance: 

~Ux) < 7 - 118 ) 

n 2-1 

La covariance est un indicateur de la variation simultanée de X et Y. En effet si, en général A et Y 
croissent simultanément, les produits (y - /t y ) (x ; ~Uz) seront positifs (corrélés positivement), tandis 
que si Y décroît lorsque X croît, ces même produits seront négatifs (corrélés négativement). 

Signalons que si nous distribuons les termes de la dernière relation, nous avons: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


327/4839 











Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


czj = co v(jr,7) = -Z< ^ - vx ) ( - my ' =-Z '• x i - x ' '■ yt -y ) 


« . 


,7 1 “7 -yi=- 


« . 


Z- 7: ; ' y* - y ' - ' y* - y ' 


\ ! 


(7.119) 


et nous avons déjà démontré que la somme des écarts à la moyenne est nulle. Dès lors nous obtenons 
une autre forme courante de la covariance: 


C XY= cov^f.y) = -Tl - V i i y ; . - y i =-T ^ i V, ' (7.120) 

«7 «7 


et par symétrie: 


c Z,Y = cov(Jf ,7) = ~Zi ^ “ * ' '>! ~y '1 = -Z>! ( x j - x 1 (7.121) 


Donc au final, dans le cas équiprobable, nous avons finalement les trois relations équivalentes 
importantes utilisées dans différents chapitres du présent site: 

J 1 

(7.122) 

-V>v - Xi 
n . 

Dans le chapitre de Méthodes Numériques pour notre étude de la régression linéaire et de l'analyse 
factorielle nous aurons besoin de l'expression explicite de la propriété de bilinéarité de la variance. Pour 
voir en quoi cela consiste exactement, considérons trois variables aléatoires X, Y et Z et a et b deux 
constantes. Alors en utilisant la troisième relation donnée précédemment, nous avons: 


C X Y = cov(Jif,7) = — T " 1 1 Xj - x if y i - 

«7 

c X Y = cov(Jf, Y) = -T J x i y i -xÿ 
n . 

ex Y = co v(X,Y) = -T. x i -ÿ i = ■ 

? K V 


cov 1 Y,aX + bZ 1 = — 'T'iy i - y i \ax i + bz i 


n 


2 


= 7 Z[■ yi -y tax i +, yi~y ]bz -> ] =7 

1 


« . 


1 


Z'>!- y 1 ax i + Z 1 > ! i ~ y ■ bz i 


(7.123) 


= a — V i Xi ~ y 'Xj + b — . . 1 yj - y <Zj - a cov( X, 7) + b cov(7, Z) 

N i 


* i 


Cette dernière relation est elle aussi importante et sera utilisée dans plusieurs chapitres du site 
(Économie, Méthodes Numériques). Elle nous permet aussi d'obtenir directement des covariances entre 
des sommes de variables. 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


328/4839 










Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

Exemple: 

Si X, Y, Z, T sont quatre variables aléatoires définies sur la même population, nous voulons calculer la 
covariance suivante: 


cov i 3X + 5Y,4Z - 2T ) (7.124) 

Nous allons donc développer en deux fois (raison pour laquelle nous appelons cela la "bilinéarité"). 
D'abord par rapport au second argument (arbitrairement!): 

cov 3X +57,4Z -2T< = 4cov 3X + 57,Z )- 2covi 3X+5Y,T\ (7.125) 

et ensuite par rapport au premier: 

cov. 3X + 5Y,4Z- 2T ■ = 4[3cov. X,Z > +5cov.7,Z i]- 2[3cov( X,T) + 5cov( Y,T,~\ (7126) 
Donc au final: 

cov ' 3X + 5Y,4Z - 2 T < = 12 cov > X,Z > + 20 cov < Y,Z i - 6 cov X,T < -10 cov < Y,T > (7.127) 

Maintenance, considérons jjjf un vecteur de composantes (x 1 ,x 2 ,...,x Ji ) et y un autre vecteur de 
composantes (y lr y 2 >■■■>>!*) » tous deux étant des variables aléatoires, le calcul de la covariance des 
composantes deux à deux donne ce que l'on appelle la "matrice des covariances" (outil très utilisé en 
finance, dans la gestion en général et les méthodes numériques statistiques!). 

Effectivement, si nous notons: 


x m - ] 


= c M ,« ( 7 - 128 > 


Nous pouvons dès lors écrire une matrice symétrique (le plus souvent dans la pratique elle est carrée) 
sous la forme: 







' c n . 

C l »' 


c m,n ~ 

: C 22 

: 



: C 33 

: 



m C ?al 

C MH _ 



( 7 . 129 ) 


Cette matrice a comme propriété remarquable que si nous prenons deux vecteurs identiques (dont les 
composantes sont les mêmes variables aléatoires) et que nous calculons la matrice, alors la diagonale de 
cette dernière donnera les variances des composantes de vecteurs (voir les exemples dans le chapitre 
d'économétrie)! Raison pour laquelle cette matrice est souvent appelée "matrices des variances- 
covariances" et se retrouve donc parfois notée également sous la forme suivante: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


329/4839 










Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


V\X, 


cov X m X\ ' 


Vi X? 


cov. X^X n 


V<X 3 i 


n.x m ) 





« 



(7.130) 


Cette matrice a pour avantage de montrer rapidement quelles sont les couples de variables qui ont une 
covariance négative et donc... dont la variance de la somme est plus petite que la somme des variances. 


Remarque : Cette matrice est très importante et nous la retrouverons fréquemment dans le chapitre 
d'Économie lors de notre étude da la théorie du portefeuille et dans les techniques de fouille de 
données (data mining, clustering) dans le chapitre de Méthodes numériques (l'analyse par 
composantes principales). 


Rappelons maintenant que nous avions un axiome en probabilités (cf. chapitre de Probabilités) qui 
énonçait que deux événements A,B sont indépendants si: 

P(AnB) = P{A)-P{B) (7.131) 

De la même façon, par extension, nous définissons l'indépendance des variables aléatoires discrètes. 
Définition: Soit X, Y deux variables aléatoires discrètes. Nous disons que X, Y sont indépendantes si: 

e JBL.P(X = x.Y = y) = P{X = x)-P{Y=y) (7.132) 

Plus généralement, les variables discrètes X l ,..,X n sont indépendantes (en bloc) si: 


Vx lr ..,x„ eW,P(X 1 = x l? ...,X n = x n ) = J - [• (7.133) 

!=1 

L'indépendance de deux variables aléatoires implique que leur covariance est nulle (la réciproque est 
fausse!). Prouvons ceci dans le cas où les variables aléatoires ne prennent qu'un nombre fini de valeurs 

{x i ) I et {vyj^ respectivement, avec /, J des ensembles finis: 


s(x-y)-J i p(x - t.r-yj )w-Z p(x-- y^t 


2,J 








(7.134) 


E(X)-E(Y) 


et donc: 


c XJ = E(XX)-E(X)E(Y) = 0 (7.135) 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


330/4839 















Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


Remarque : Donc plus la covariance est faible, plus les séries sont indépendantes. A l'inverse, plus la 
covariance est élevée, plus les séries sont liées. 


Etant donné que: 


V(X + Y) = V(X) + V(Y) + 2c xx (7.136) 
siX, Y sont indépendantes alors c X Y = 0 : 

V(X+Y) = V(X)+V(Y) (7.137) 

De manière plus générale si X 1? ..,X n sont indépendantes (en bloc) alors pour toute loi statistique (!) 
nous avons: 


V 


2A 


2=1 


i-l 


(7.138) 


3.1.3. ESPÉRANCE ET VARIANCE DE LA MOYENNE (ERREUR STANDARD ET FCP) 


Souvent en statistique, il est utile de déterminer l'écart-type de la moyenne empirique (ou en d'autres 
termes...: l'erreur quadratique moyenne). Voyons de quoi il s'agit: 

Soit la moyenne d'une série de termes déterminés chacun par la mesure de plusieurs valeurs (il s'agit au 
fait de son estimateur dans un cas particulier comme nous le verrons beaucoup plus loin): 

X = -(Xj+X 2 +...+XJ (7.139) 

n 


alors en utilisant les propriétés de l'espérance: 

E{X) = -{EiX,) + E(X 2 ) + ... + E{X n )) (7.140) 
n 


et si toutes les variables aléatoires sont identiquement distribuées et indépendantes nous avons alors: 

E{X) = -nfi = }â (7.141) 
n 


Remarque : Nous démontrerons bien plus loin que si toutes les variables aléatoires sont 
identiquement distribuées et indépendantes et de variance finie, alors l'espérance suite une 
asymptotiquement une loi Normale. 


Pour la variance, le même raisonnement s'applique: 

V(X)= 4 =-L(ir ( X l ) + lT(X 2 ) + ...+V(X„)) = 4-( £7l 2 +a - 2 2 + ... + 0 ^) (7.142) 

fl fl 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


331/4839 
















Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

et si les variables aléatoires sont toutes identiquement distribuées et indépendantes (nous étudierons 
plus loin le cas très important et courant dans la pratique où cette dernière condition n'est pas 
satisfaite): 


_ o O 2 

V(X)=t& = -' 


( 7 . 143 ) 


d'où l'écart-type de la moyenne appelé aussi "erreur-type", "erreur-standard" ou encore "variation non 
systématique": 



( 7 . 144 ) 


et il s'agit rigoureusement de l'écart-type de l'estimateur de la moyenne (c'est peut-être plus clair ainsi)! 


Cette relation se trouve dans de nombreux logiciels dont les graphiques Microsoft Excel (mais il n'y a 
pas de fonction intégrée), écrite soit avec l'écart-type (comme ci-dessus), soit avec la notation de la 
variance (suffit de mettre au carré...). 


Signalons que la dernière relation peut être utilisée même si la moyenne des n variables aléatoires n'est 
pas identique! La condition suffisante étant juste que les écarts-types soient tous égaux et c'est le cas de 
l'industrie (production). 

Nous avons donc: 


r(S„) = <j 2 (S„) = na 2 r(M„)=o 2 (M»)= — 

n 


( 7 . 145 ) 


où S n désigne la somme des n variables aléatoires et M n leur moyenne. 
La variable centrée réduite que nous avions introduite plus haut: 

Y = ( 7 . 146 ) 

cr 


peut alors s’écrire de plusieurs manières: 


Y = 


^ H 

c+Jh 



( 7 . 147 ) 


Par ailleurs, en supposant que le lecteur sache déjà ce qu’est une loi Normale o) , nous 
démontrerons plus loin en détails car c’est extrêmement important (!) que la loi de probabilité de la 
variable aléatoire V > moyenne de n variables aléatoires identiquement distribuées et linéairement 
indépendantes, est alors la loi: 


/ 

N 

\ 


cr 


\ 



( 7 . 148 ) 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


332/4839 















Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

3.1.4. COEFFICIENT DE CORRÉLATION 

Maintenant, considérons A et Y deux variables aléatoires ayant pour covariance: 

Cx.Y = S [( X ~ " M')] (7.149) 


Nous avons: 


[c XY ) 2 <v{xyv{Y) ( 7 . 150 ) 

nous allons démontrer cette relation immédiatement car l'utilisation de la covariance seule pour 
l'analyse des données n'est pas géniale car elle n'est pas à proprement parler bornée et simple d'usage 
(au niveau de l'interprétation). Nous allons donc construire un indicateur plus facile d'usage en 
entreprise. 

Démonstration: 


Choisissons une constante a quelconque et calculons la variance de: 

aX + Y (7.151) 


Nous pouvons alors immédiatement écrire à l'aide des propriétés de la variance et de l'espérance: 

V{aX + Y) = a 2 V(X) + 2 ac xv + V{Y) (7.152) 


La quantité de droite est positive et nulle en tout a par construction de la variance (de gauche). Donc le 
discriminant de l'expression, vue comme un trinôme en a du type: 


P(x) = ax 2 + bx + c = , 


b 

x+ — 
2a j 


Y 


b 2 - 4ac 
~^ T ~ 


P(a) = V{X)a 2 + 2c XY a + V(Y) = V{X) 


?r 

Zc X,Y 
iiï H- 

2V(X) 


(7.153) 

(2^,r) 2 ~4 V(X)V{Y) 

4V(X") 2 


Donc pour que P(a) soit positif pour tout a nous avons comme seule possibilité que: 

[ 2c xx f - 4F(X)V(Y') < 0 (7.154) 

Soit après simplification: 

(c^y) 2 <V(X)V(Y) (7.155) 


□C.Q.F.D. 


Ce qui nous donne: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


333/4839 
















Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


(7-156) 

nx)VQC> jr(X)V(Y) 


Finalement nous obtenons une forme de l'inégalité statistique dite "inégalité de Cauchy-Schwarz": 


C y y 

-1< ’- <1 (7.157) 

ylnXWiŸ) 

Si les variances de X et Y sont non milles, la corrélation entre X et Y est définie par le "coefficient de 
corrélation linéaire" (il s'agit donc de la covariance standardisée afin que son amplitude ne soit pas 
dépendante de l'unité de mesure choisie): 


R 


'XJ 


XJ 


(7.158) 


#(W) 

ce qui peut aussi s'écrire sous forme développée (en utilisant la relation de Huyghens): 
E(XY) - E(X)E(Y) E{XY) - E{X)E{Y) 


R x,? = 


^V(XW(Y) ^£(jf 2 ) - £( jf) 2 ) (£(7 2 ) - £(7) 2 ) 


(7.159) 


ou encore plus condensée: 


R X,? = 


C X,Y 

a(X)a(.Y) 


(7.160) 


Signalons que normalement, la lettre R est réservée pour dire qu'il s'agit d'un estimateur du coefficient 
de corrélation alors que la définition ci-dessus n'est pas un estimateur et qu'en toute rigueur, nous 
devrions alors noter Px,Y selon les traditions d'usage. 


Quels que soient l'unité et les ordres de grandeur, le coefficient de corrélation est un nombre sans unités 
(donc sa valeur ne dépend pas de l'unité de mesure choisie, ce qui n'est de loin pas le cas de tous les 
indicateurs statistiques!), compris entre -1 et 1. Il traduit la plus ou moins grande dépendance linéaire 
de X et Y et ou, géométriquement, le plus ou moins grand aplatissement. Nous pouvons donc dire qu'un 
coefficient de corrélation nul ou proche de 0 signifie qu'il n'y a pas de relation linéaire entre les 
caractères. Mais il n'entraîne aucune notion d'indépendance plus générale. 

Quand le coefficient de corrélation est proche de 1 ou -1, les caractères sont dits fortement corrélés. Il 
faut prendre garde à la confusion fréquente entre corrélation et causalité. Cependant, que deux 
phénomènes soient corrélés n'implique en aucune façon que l'un soit cause de l'autre. 

Ainsi: 


- Si R x y = -1 nous avons affaire à une corrélation négative dite "corrélation négative parfaite" (dans la 
cas d'une relation linéaire tous les points de mesures sont situés sur une droite de pente négative). 

-Si -1 < R x y < 1 nous avons affaire à une corrélation négative ou positive dite "corrélation imparfaite" 
(dans la cas d'une relation linéaire tous les points de mesures sont situés sur une droite de pente 

[Vincent ISOZ] | http://www.sciences.ch] | Page: 


334/4839 



















Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

négative ou respectivement positive). 

- Si R x y = 0 la corrélation est nulle... (dans la cas d'une relation linéaire tous les points de mesures sont 
situés sur une droite de pente nulle). 

- Si Kg y = 1 nous avons affaire à une corrélation positive dite "corrélation positive parfaite" (dans la 
cas d'une relation linéaire tous les points de mesures sont situés sur une droite de pente positive). 

L'analyse du coefficient de corrélation poursuit donc l'objectif de déterminer le degré d'association 
entre les différentes variables: celui-ci est souvent exprimé par le coefficient de détermination, qui est 
le carré du coefficient de corrélation. Le coefficient de détermination mesure donc la contribution d'une 
des variables à l'explication de la seconde. 

En utilisant les expressions de la moyenne et de l'écart-type de variables équiprobables telles que 
démontrées plus haut, nous passons de: 

R B{Jür)-E(X)Bçr) 

E(Xf)(E(Y 2 )- E(Yf) 

à l'estimateur du coefficient de corrélation: 


1 « i « i » 


- 


« E-= 


jfc=l 


jfc=l 


« lr = 


jfe = l 


n *=i n U=i 


H \ 2 


\*=1 J 


( \ 2 
Z-^ 

n *=i n V*=i / 


.2 1 


(7.162) 


où nous voyons que la covariance devient alors la moyenne des produits moins le produit des 
moyennes. 


Soit après simplification: 


h | n h 

Zvi --Z^Z^ü 

p _ k=\ n *=1 *=1 

XJ 

1 

” 2 i r ” Y 

z**-- z* 

Il jfc=l M U=1 J 

n n / n 

Z yi~- Z y* 

*=i n u=i J 


(7.163) 


Le coefficient de corrélation peut être calculé dans version française de Microsoft Excel 11.8346 avec 
entre autres la fonction intégrée COEFFICIENT.CORRELATION( ). 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


335/4839 





























Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


Remarques: 

RI. Dans la littérature le coefficient de corrélation est souvent appelé "coefficient d'échantillonnage 
de Pearson" (dans le cas équiprobable) ou "test de Bravais-Pearson" (dans le cas non équiprobable) 
et lorsque nous le portons au carré, nous parlons alors de "coefficient de détermination". 

R2. Souvent le carré de ce coefficient est un peu abusivement interprété comme le % de variation 
expliqué de la variable étudiée Y par la variable explicative X. 


Enfin, à noter que nous avons donc la relation suivante qui est énormément utilisée dans la pratique 
(voir le chapitre d'Économie pour des exemples fameux!): 

V{X+Y) = V(X) + V(Y) + 2R. xy 4V(X)V(Y) (7.164) 


ou sa version avec l'écart-type: 


'X+Y 




X ^Y ^^X Y ^"x^"y 


(7.165) 


Il s'agit d'une relation que l'on retrouve souvent en finance dans le cadre du calcul de la VaR selon la 
méthodologie RiskMetrics proposée par J.P. Morgan (cf. chapitre d'Économie). 


Exemple: 

Une compagnie aérienne a à sa disposition 120 sièges qu'elle réserve pour des passagers en 
correspondance venant de deux autres vols arrivés un peu plus tôt dans la journée et en partance pour 
Francfort. Le premier vol arrive de Manille et le nombre de passagers à son bord suit une loi Normale 
de moyenne 50 et de variance 169. Le second vol arrive de Taipei et le nombre de passagers à son bord 
suit une loi Normale de moyenne 45 et de variance 196. 


Le coefficient de corrélation linéaire entre le nombre de passagers des deux vols est mesuré comme 
étant: 


r x,y = 0-5 U-166) 

La loi que suit le nombre de passagers pour Francfort si nous supposons que la loi du couple suit elle 
aussi une loi Normale (selon énoncé!) est: 

X+Y = N{fx x +fx v ,V{X + Y)) (7.167) 


avec: 


}à x + = 50 + 45 = 95 (7.168) 


et: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


336/4839 












Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


V{X+Y) = V{X) + V{Y) + 2R xy ^V(X)V(Y) 


ce qui donne: 


V(X + Y)= 169 + 196 + 2 ■ 0.5^/169 ■196 = 169 + 196 + 182 = 547 (7-170) 

3.2. VARIABLES CONTINUES 

Définitions: 

Dl. Nous disons que X est une variable continue si sa "fonction de répartition" est continue (déjà 
définie plus haut). La fonction de répartition de X étant définie par: 

F (Y) = P(X < x) Ÿ^eK (7.171) 

soit la probabilité cumulée que la variable aléatoire X soit plus petite ou égale à la valeur x fixée. Nous 
avons aussi bien évidemment: 


1>/TO>0 (7.172) 


D3. Nous appelons: 


G(x) =l-i?(x)= P[X >x\ (7.173) 

la "fonction de survie" (survival function) ou "fonction de queue" (tail distribution function). 

D2. Si de plus la fonction de répartition F de X est continûment dérivable de dérivée P appelée 
"fonction de densité" ou "fonction de masse" ou encore "fonction de distribution" alors nous disons que 
X est absolument continue et dans ce cas nous avons: 


*2 

<X <x 2 ) = | p{x)dx = F y X'i \ — F\ ' xj } (7.174) 

*i 


avec la condition de normalisation: 


-KD 

P(X < +oo) = J p{x)dx- 1 (7.175) 

-0Q 

Toute fonction de distribution de probabilité doit satisfaire l'intégrale de normalisation dans son 
domaine de définition! 


Remarque : Il est intéressant de remarquer que la définition amène à ce que la probabilité qu'une 
variable aléatoire totalement continue prenne une valeur donnée est nulle! Donc ce n'est pas parce 
qu'un événement a une probabilité nulle qu'il ne peut arriver! ! ! 


La moyenne ayant été définie par la somme pour une variable discrète, elle devient une intégrale pour 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


337/4839 











Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

une variable continue: 


-Ko 

E{X) - J xp(x)dx 

-0Q 


(7.176) 


et la variance s'écrit donc: 


-KO 

nX)= J [x-E(X)fp(x)dx 

-OO 


(7.177) 


Nous avons alors aussi la médiane qui est logiquement redéfinie dans le cas d'une variable aléatoire 
continue par: 



-OO -OO 


(7.178) 


et elle coïncide rarement avec la moyenne! 

Souvent les statisticiens utilisent les mêmes notations pour l'espérance mathématique d'une variable 
continue: 


et pour la variance: 


E(X),M(X),p x ,p (7.179) 

(7.180) 


que pour une variable discrète. 

Par la suite, nous calculerons ces différents termes avec développements uniquement dans les cas les 
plus usités. 

3.3. POSTULAT FONDAMENTAL DE LA STATISTIQUE 

Le but ultime de la statistique est de remonter de l'échantillon à la fonction de répartition analytique qui 
lui aurait donné naissance. Ce but sera présenté dans le cadre de ce site internet comme un postulat 
(bien que cela postulat soit très difficile à appliquer dans la pratique). 

Postulat: À toute fonction de répartition empirique P n (x) nous pouvons associer une fonction de 

répartition théorique F(x ) vers laquelle elle converge quand la taille de l'échantillon est suffisamment 
grande. 

Si: 


X n =sup F n {x)-F{x) 


(7.181) 


est la variable aléatoire définie comme la plus grande différence (en valeur absolue) entre F n ( x ) et 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


338/4839 












Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

F(x) (observée pour toutes les valeurs de x pour un échantillon donné), alors X n converge vers 0 
presque sûrement. 


Remarque : Les mathématiciens de la statistique arrivent à démontrer ce postulat sous forme d'un 
théorème appelé le "théorème fondamental de la statistique" ou "théorème de Glivenko-Cantelli" en 
ce qui concerne les fonctions continues. Personnellement, quitte à choquer les connaisseurs, je 
considère que cette démonstration n'en est pas une car elle est très éloignée ce que montre 
l'expérience (oui c'est mon côté physicien qui ressort...) et ce résultat théorique amène un grand 
nombre de praticiens à faire souvent tout leur possible (exclusion de données, transformations et 
autres abominations) pour trouver une loi connue à laquelle ils peuvent ajuster leurs données 
mesurées. 


4. INDICE DE DIVERSITÉ 


Il arrive dans le domaine de la biologie ou de l'entreprise que l'on demande à un statisticien ou analyste 
de mesurer la diversité d'un certain nombre d'éléments prédéfinis. Par exemple, imaginons une 
multinationale ayant une gamme de produits bien définie et dont certains magasins (clients) dans le 
monde peuvent choisir un sous-ensemble de cette gamme pour leur commerce. La question étant alors 
de faire un ranking des magasins qui vendent la plus grande diversité de produits de la marque et ce en 
prenant en compte aussi les quantités. 

Par exemple, nous avons une liste de 4 produits au total dans notre catalogue. Le hasard faisant, trois 
de nos clients vendent nos 4 produits mais nous souhaiterions savoir lequel en vend la plus grande 
diversité et ce en prenant en compte les quantités. 

Nous avons les données de ventes par produit suivantes pour le client 1 : 


Client 1 

Produit 1 

5 

Produit 2 

5 

Produit 3 

5 

Produit 4 

5 


pour le client 2: 


Client 2 

Produit 1 

1 

Produit 2 

1 

Produit 3 

1 

Produit 4 

17 


et pour le client 3: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


339/4839 





















Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


Client 3 

Produit 1 

2 

Produit 2 

2 

Produit 3 

2 

Produit 4 

34 


Une mesure de l'information (diversité des états) qui peut être bien adaptée à cette mesure est la 
formule de Shannon introduite dans le chapitre de Mécanique Statistique dont l'espérance est: 

= E{k(x)} = -À^ Pi \og{ Pi ) (7.182) 

Z J 

Arbitrairement, nous prendrons A = 1 et la base 10 pour le logarithme (ainsi, si nous avons 10 variables 
équiprobables, l'entropie sera unitaire par exemple...). 

Dès lors il vient: 


% = “Z, Pi log [Pi ) (7-183) 

!=1 

Nous allons récrire cela de manière plus adéquate pour l'application en entreprise. Ainsi, si n est le 
nombre de produits et Pi est la proportion (ou "fréquence relative") de ventes du produit i parmi la 
totalité des ventes N nous avons alors: 


Pi = 


k 

n 


(7.184) 


Il vient alors: 




n n 


Z^[ _lo êU)+ lc> gC^)] iog(*)ZJï-EJîM;î) 


i=i 


1=1 Z —1 


(7.185) 


N 


N 


^log(^)-Z^logU) 

_M_ 

N 


Nous avons alors pour le client 1 : 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


340/4839 
















Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


1=1 


_ 201og(20) - (51og(5) + 51og(5) + 51og(5) + 51og(5)) ( 7186 ) 

“ 20 

= 20 '° S(20) 2 ~201°«^ =log(20) - logÇS) = log(4) = 0.602 
qui est la valeur maximale possible (chaque état est équiprobable). Et pour le client 2 nous avons: 


*nog(AO-ZJîiogU) 


201 og(20) - (1 log(l) +11 og(l) +1 log(l) +17 log(17) ) 

20 


et pour le client 3: 


Jnog(tf)-ZJîiogU) 

C' ___ 

2 N (7.188) 

_ 401og(40)-(21og(2) + 21og(2) + 21og(2) + 341og(34))_ n w 

40 

Ainsi, le client ayant la plus grande diversité est le premier. Nous voyons aussi une propriété 
intéressante de la formule de Shannon à l'aide des clients 2 et 3 c'est que la quantité n'influe pas sur la 
diversité (puisque la seule différence entre les deux clients est la quantité qui est multipliée d'un facteur 
2 et non la diversité)! 

5. FONCTIONS DE DISTRIBUTIONS 


Lorsque nous observons des phénomènes probabilistes, et que nous prenons note des valeurs prises par 
ces derniers et que nous les reportons graphiquement, nous observons toujours que les différentes 
mesures obtenues suivent une caractéristique courbe ou droite typique fréquemment reproductible. 

Dans le domaine des probabilités et statistiques, nous appelons ces caractéristiques des "fonctions de 
distribution" car elles indiquent la fréquence avec laquelle la variable aléatoire apparaît avec certaines 
valeurs. 


Remarque : Nous utilisons aussi simplement le terme "fonction" ou encore "loi" pour désigner ces 
caractéristiques. 


Ces fonctions sont en pratique bornées par ce que nous appelons "l'étendue de la distribution", ou 
"dispersion de la distribution", qui correspond à la différence entre la donnée maximale (à droite) et la 
donnée min imale (à gauche) des valeurs observées: 


E = Max-Min (7.189) 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


341/4839 


















Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

notée souvent aussi R dans l'ingénierie de la qualité (cf. chapitre de Génie Industriel). 

Si les valeurs observées se distribuent d'une certaine manière c'est qu'elles ont alors une probabilité 
d'avoir une certaine valeur de la fonction de distribution. 

Dans la pratique industrielle (cf. chapitre de Génie Industriel), la dispersion des valeurs statistiques est 
importante parce qu'elle donne une indication sur la variation d'un processus (variabilité). 

Définitions: 

Dl. La relation mathématique qui donne la probabilité qu'a une variable aléatoire d'avoir une valeur 
donnée de la fonction de distribution est appelée "fonction de densité", "fonction de masse" ou encore 
"fonction marginale". 

D2. La relation mathématique qui donne la probabilité cumulée qu'a une variable aléatoire d'être 
inférieure ou égale à une certaine valeur est nommée la "fonction de répartition" ou "fonction 
cumulée". 

D3. Des variables aléatoires sont dites "indépendantes et identiquement distribuées" (i.i.d.) si elles 
suivent toutes la même fonction de distribution et qu'elles sont indépendantes... 


Remarque : Le lecteur pourra trouver la fonction de distribution de Weibull (ou "loi de Weibull") 
dans le chapitre traitant du Génie Industriel (section sur l'Ingénierie), et la fonction logistique dans 
le chapitre de Méthodes Numériques. 


De telles fonctions étant très nombreuses dans la nature, nous proposons au lecteur une étude détaillée 
des plus connues seulement. 

5.1. FONCTION DISCRÈTE UNIFORME 


Si nous admettons qu'il est possible d'associer une probabilité à un événement, nous pouvons concevoir 
des situations où nous pouvons supposer a priori que tous les événements élémentaires sont 
équiprobables (c'est-à-dire qu'ils ont même probabilité). Nous utilisons alors le rapport entre le nombre 
de cas favorables et le nombre de cas possibles pour calculer la probabilité de tous les événements de 
l'Univers des événements U. Plus généralement si U est un ensemble fini d'événements équiprobables et 
A une partie de U nous avons sous forme ensembliste: 

P(A) = Card (A) / Car J (U) (7.190) 

Plus communément, soit e un événement pouvant avoir N issues équiprobables possibles. Alors la 
probabilité d'observer l'issue donnée de l'événement suit une "fonction discrète uniforme" (ou "loi 
discrète uniforme") donnée par la relation: 


P e =1 iN 


(7.191) 


Ayant pour espérance (ou moyenne): 


V=E{X) = ^p i X i =P e ^7 k (7.192) 

i i 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


342/4839 











Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


Si nous nous mettons dans le cas particulier où x j = i avec i = l,.,A r - Nous avons alors (cf. chapitre de 
Suites et Séries): 


E ( x ) = irX ï = 


1 1 N(N+Ï) ^ + 1 




N 


(7.193) 


Et pour variance: 


N 


1 . i JV . i (N N N ^ 

nx) = Z jj 0 ■- ^) 2 vf = Z Z* 2 - +Z^ 2 

i=l i=l \i=\ i=l i=l 


N 


f N 


N 


\ 


\i=l 


i=l 


1^.2 2 " 


Z* -2Æ i+Jw iw J=jÿS i 


1 {N(N + Ï)(2N+Ï)] 2 N+l 


N 


N\ 


6 


X 2 U 


ZH 


1=1 


Ù/+1 


(AT+1)(2AT+1) AT + 1^. (tf + 1) 

6 ÂT tï î+ 4 

(AT+1)(2AT+1) AT + l(Af(AT + l)') (AM-1) 


6 


AT 


/ 


(AT+1X2AT+1) (ù^+l) 2 ! (^+1) 2 _ (^ + 1)(2^ + 1) C^+l) 2 

6 2 4 ~ 6 4 

2(AT+l)(2tf+l) 3(^+l) 2 _ 2{N+1)(2N +1) -3{N +1) 2 


12 


12 


12 


12 


12 


N 2 -1 
12 


(7.194) 


2{2N 2 +N + 2N+\)-3N 2 -6N-3 AN 2 +6N+2-3N 2 - 6N-3 


Voici un exemple de tracé de la fonction de distribution et respectivement de répartition pour la loi 
discrète uniforme de paramètres {1,5,8,11,12} (nous voyons que chaque valeur est bien équiprobable): 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


343/4839 


































Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 



Figure: 7.8 - Loi discrète uniforme (fonction de distribution et de répartition) 


5.2. FONCTION DE BERNOULLI 


Si nous avons affaire à une observation binaire alors la probabilité d'un événement reste constante d'une 
observation à l'autre s'il n'y a pas d'effet mémoire (autrement dit: une somme de variables de Bernoulli, 
deux à deux indépendantes). 

Nous appelons ce genre d'observations où la variable aléatoire a valeurs 0 (faux) ou 1 (vrai), avec 
probabilité (l-p),p respectivement, des "essais de Bernoulli" avec "événements contraires à 
probabilités contraires". 


Ainsi, une variable aléatoire X suit une "fonction de Bernoulli" (ou "loi de Bernoulli") si elle ne peut 
prendre que les valeurs 0 ou 1, associées aux probabilités q etp de sorte que q + p = 1 et: 


P{X = V)=q P(X = ï) = p = (l-q) 


(7.195) 


L'exemple classique d'un tel processus est le jeu de pile de face ou de tirage avec remise. Il est inutile 
de vérifier formellement que la probabilité cumulée est unitaire... 


Remarquons que par extension, si nous considérons N événements où nous obtenons dans un ordre 
particulier k fois une des issues possible (réussite) et N-k l'autre (échec), alors la probabilité d'obtenir 
une telle série (de k réussites et N-k échecs ordonnés dans un ordre particulier) sera donnée par: 

P = p k ■ (1 - p f-*' = / ' q*-* (7.196) 


conformément à ce que nous avions obtenu en combinatoire dans le chapitre de Probabilités! 
Voici un exemple de tracé de la fonction de répartition pour q = 0.3 : 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


344/4839 






















Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


i T 


o.s- 


0 . 6 - 

y 

OA- 


0 . 2 - 

0 0.2 0.4 0.6 O.S 1 1.2 1.4 1.6 1 .S 

x 

Figure: 7.9 - Loi de Bernoulli (fonction de distribution et de répartition) 

La fonction de Bernoulli a donc pour espérance (moyenne): 

V=E(X) =5>i -*i =l-p + 0-(l~p)=p (7.197) 
et pour variance (nous utilisons la relation de Huyghens démontrée plus haut): 

V(X)=a 2 = E[X-E(X)f =E(X 2 )-E(X) 2 =E(X 2 )-p 2 = p-p 2 =p(l-p)=pq (7.198) 


Remarque : L'exemple ci-dessus n'est certes par pertinent mais nous verrons dans le chapitre de 
Techniques De Gestion que la fonction de Bernoulli apparaît naturellement au début de notre étude 
des files d'attentes. 


5.3. FONCTION GÉOMÉTRIQUE 

La loi géométrique ou "loi de Pascal" consiste dans une épreuve de type Bernoulli, dont la probabilité 
de succès est p et celle d'échec q = 1 - p sont constantes, que nous renouvelons de manière 
indépendante jusqu'au premier succès. 

Si nous appelons Xla variable aléatoire donnant le rang du premier succès la probabilité que X = k est 
alors (cas particulier de la fonction de Bernoulli): 


m = q h *P 


(7.199) 


avec * e ■ 

Cette loi a pour espérance: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


345/4839 














Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


E(X) = ^p i x i =^kq k l p=^k{\-pf i p = p^k{\-pf 1 (7.200) 

k k k 

Or, cette dernière relation s’écrit aussi (car c’est une simple série géométrique): 


vjfe-l 


vjfc-1 


*-i \\-q) 


2 (7.201) 


Effectivement, nous avons démontré dans le chapitre sur les Suites et Séries que: 

K l-q s+1 


Z^=V 

jt_n i ' 


(7.202) 


Jt-o 1 _l 7 

En prenant la limite lorsque n —>+oo nous obtenons: 


Z J = T— ( 7 ' 203 > 

Jt-0 1 


car 0 < q < 1. 

Ensuite, il suffit de dériver les deux membres de l'égalité par rapport à q et nous obtenons: 

ZV 4 = 1 a (7.204) 

*-i \}-q) 

Nous avons donc le nombre moyen d'essais X qu'il faut faire pour arriver au premier succès: 

p 1 


,g(x) = 2y ppr=*:)=2> ? w = 


Jt-0 


jt-o (l-i?) ? 


(7.205) 


Calculons maintenant la variance en rappelant comme à chaque fois que (relation de Huyghens): 

V{X) = e{x 2 )-E{X) 2 (7.206) 

Commençons donc par calculer E[ X 2 J : 


E (■ x ' 2 )=Z k2p (■ x = k ) =Æ = p 2L k ■ (■ k - 1 +i) ^ =Æ k ■ (* 1 ) Z -1 +Æ 

Jt-0 Jt-0 Jt-0 Jt-1 Jt-0 

(7.207) 

Le dernier terme de cette expression est l'équivalent de l'espérance calculée précédemment. Soit: 

Pf,^ = - (7-208) 

Jt-0 P 


JH 


Il reste à calculer: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


346/4839 











Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


p^k- (7.209) 
Jt-1 


Nous avons: 


p^k-{k-\)q k 1 = pq^k^k-tyq*" 2 (7.210) 
Jt-l Jt-2 


Or en dérivant l'égalité: 




JU1 



(7.211) 


Nous obtenons: 


2*(*-l),« =(7.212) 

(W) 


JU1 


Par conséquent: 


P^k(k-\)q kA = pq^k(k-\)q^ 2 = ^ ^ (7.213) 


JU1 


Jt-a 


(w) ^ 


Donc: 


E(X 2 )=^ + - (7.214) 

P P 


Pour fin ir : 


V{X) = E[X 2 )-E{Xf 


2 q 1 

? + r 



î - p 

—r ( 7 - 215 ) 

p 


Exemple: 

El. Vous essayez, tard dans la nuit et dans l'obscurité, d'ouvrir une serrure au moyen d'un trousseau de 
5 clés, sans porter attention, car vous êtes un peu fatigué (ou un peu éméché...) vous essayez chaque 
clé. Sachant qu'une seule convient, quelle est la probabilité d'utiliser la bonne clé au Æ-ème essai? 


P(k) = 


MŸ 1 

jJ 



(7.216) 


E2. Tracé de la fonction de distribution et répartition pour la fonction Géométrique de paramètre 
^ = 0.5: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


347/4839 













Figure: 7.10 - Loi géométrique (fonction de distribution et de répartition) 


Déter min ons maintenant la fonction de répartition de la loi Géométrique. Nous partons donc de: 

P(k) = q kA p (7.217) 

nous avons alors par définition la probabilité cumulée que l'expérience réussisse dans les n premiers 
essais: 


+oq -Ko 

P{X<n) = 1-2 Z ^ ( 7 - 218 > 

3-n 

avec n entier valant 0 ... 1 ... 2 , etc. 

Posons: 

j-\ = n + k=>k = n-j + \ 

Nous avons alors: 

-Ko -Ko 

P{X <n)= = 1 = 1 -pq 

jfc=0 jfe=Ü 

1 ~q 

5.4. FONCTION BINOMIALE 

Si nous revenons maintenant à notre épreuve de Bernoulli. Plus généralement, tout ./V-uplet particulier 
formé de k succès et de N-k échecs aura pour probabilité (dans le cadre d'un tirage avec remise ou sans 
remise si la population est grande en première approximation...): 

P{N,k) =p y (7.221) 

d’être tiré (ou d’apparaître) quel que soit l’ordre d’apparition des échecs et réussites. 

Mais, nous savons que la combinatoire permet de déterminer le nombre de 7V-uplets de ce type (le 

[Vincent ISOZ] | http://www.sciences.ch] | Page: 


(7.219) 


-Ko 
n ST 1 k 


S .., k i ^ n 

q =i-pq z — 

ifc=0 1 1 


17.2201 


348/4839 

























Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

nombre de manières d'ordonner les apparitions d'échecs et de réussites). Le nombre d'arrangements 
possibles étant, nous l'avons démontré (cf. chapitre Probabilités), donné par le coefficient binomial 
(notation non conforme sur ce site à la norme ISO 31-11): 


cf- 


N\ 

*!■(#-*)! 


(7.222) 


Donc comme la probabilité d'obtenir une série de k succès et N-k échecs particuliers est toujours 
identique (quel que soit l'ordre) alors il suffit de multiplier la probabilité d'une série particulière par la 
combinatoire (ceci étant équivalent à faire une somme): 

n/ il r i \ n ^ 1 k SŸ—k 

■<, ,7.223) 


pour avoir la probabilité totale d'obtenir une quelconque de ces séries possibles (puisque chacune est 
possible). 


Remarque : Cela équivaut à l'étude d'un tirage avec remise (cf. chapitre de Probabilités) simple avec 
contrainte sur l'ordre ou à l'étude d'une série de succès ou d'échecs. Nous utiliserons cette relation 
dans le cadre de la théorie des files d'attentes ou en fiabilité. Il faut noter que dans le cas de grandes 
populations, même si le tirage n'est pas avec remise il peut être considéré comme tel... 


Écrite autrement ceci donne la "fonction Binomiale" (ou "loi Binomiale") connue aussi sous la forme de 
la fonction de distribution suivante: 


P{N,k) = Cfp k (1 - pf~ k = Cfp k q N ~ k 


(7.224) 


et parfois notée: 


(7.225) 

avec un petit n ou grand N (cela importe peu...) et peut être calculée dans la version française de 
Microsoft Excel 11.8346 à l'aide de la fonction LOI.BINOMIALE( ). 

Nous disons parfois que la loi Binomiale est non exhaustive car la taille de la population initiale n'est 
pas apparente dans l'expression de la loi. 

Exemple: 

Nous souhaitons tester l'alternateur d'un groupe électrogène. La probabilité de défaillance à la 
sollicitation de ce matériel est estimée à 1 défaillance pour l'OOO démarrages. 

Nous décidons d'effectuer un test de 100 démarrages. La probabilité d'observer 1 panne au cours de ce 
test est de: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


349/4839 













Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


P(N= 100,* = 1) = C^p k q N ~ k 


N\ 


k\(N-k)\ 


p k q N ~ k 


100 ! 


1 


\i. 


1!(100-1)!U000; 


^ 99 


1- 


1000 


= 9% 


(7.226) 


Nous avons bien évidemment pour la fonction de répartition (très utile dans la pratique comme le 
contrôle de lots de fournisseurs ou la fiabilité!): 

T Cf ■ p ' q N ~ k = 1 (7.227) 

Jt-0 

Effectivement, nous avons démontré dans le chapitre de Calcul Algébrique le "théorème binomial": 

(*+ù"=Z c **V-* < 7 228 > 

k=0 


Donc: 


£ CtP t 0 - pf~ k = [P + 0 ■- P)f = l" = 1 (7.229) 

.5-=Ü 

Il vaut mieux utiliser Microsoft Excel 11.8346 (ou tout autre logiciel largement répandu) pour ne pas 
s'embêter à calculer ce genre de relations en utilisant la fonction CRITERE.LOI.BINOMIALE( ) dans 
la version française. 

L'espérance mathématique (moyenne) de P(N,k ) est: 

E{X) = j^P{x = k)k = y cf P k a - P f- k k =y cf / (i - P f~ k k (7.230) 

fc=0 fc=0 jfc=l 


Or: 



N 

k 


r*N -1 

u jfc-i 




(7.231) 


d'où: 


E(X) = ù/y cyV a - ci^ P kA (i - 

jfc=l jfc=l 

= ifrjrct 1 p t a-PŸ !, - iyt = 

.t =<Il 


(7.232) 


donne le nombre moyen de fois que l'on obtiendra l'issue souhaitée de probabilité p après N essais. 
Avant de calculer la variance, introduisons la relation suivante: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


350/4839 












Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


(tf-1)! 


En effet, en utilisant les développements précédents: 


p S q"~^ = (N-\)p (7.233) 


J'.'-l 

T * 

(AT-l) 


tf-l 

- y 



s 

!(A7- 1- 

\.-p q 

s)\ 

£o- 

1) ! ( iV — 1- 

-*)' P 

= (*■ 

jv-i 

-OStt 

i-1 (s 

(N-2)\ 
-1)!(2V- 1- 

-s)\ 

- 1 --’ = (N- 

N-2 

■1)Z 

j- 0 


5 jV-1-j 


{N- 2 )! 




j+1 tf-2-j 

p q 


N-2 


= {N-\)p^C^p^^ =(N-\)p 

s-o 


\ 

p + q 

J 


N-2 


= (AT-1) P 


Commençons maintenant le (long) calcul de la variance dans lequel nous allons utiliser les résultats 
précédents: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


351/4839 













Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 




m .[k-N-pf^ T J^ Tr y q N - k ■ [* -4 


&k\(N-k)\ 


t^k\(N-k)\: 


N 


=z^ 


N\ 


k N-k 

p q +2^ 


N 


N 


= T,r 


N 


= Z^ 


N 


= Z^ 


N 


*!(AT- 

*)! 

N\ 


k\(N- 

k)\ 

N\ 


k\(N- 

*)l 

N\ 


k\{N- 

k)\ 

N\ 



N\ 


A^-Z2^ 


N 


w *l(tf-*)l 
/^VZ ™ 


w *l(^-*)l 

iV 


AH * jv-* 
/» î 


p q - 2 / 2 ’Y' A: 


^ <7 


JV 

Æ jV-.t 2 v 1 .--vJ'■■■ r Æ JV-Æ ?r--/N Æ 

^ 0 +/* c * ^ 0 - 2/^ ^k P <? 

Æ=Ü 


JV 

Z 

jfc=0 


jfe N-k 


=1 


N 

k N-k i ,. ,2 ■-, Tij^ { --iN-\ k N-k 


jfc=l 


=ï$=M 


= y ^ 

à *!(^-*:)! 

= -/2 2 +iV2> 


JV 


Z/™ V-2.w 2 = 2> : 


AT! 


^ ^ ! (i\A — Ær) ! 

N -1 


k N-k ..2 


" Wîzî!_^ - v+wsc+î 


ÉJ (*-5l(AT-*)l 


J? <7 


s=k -1 


(TV-1)! 


j=0 


s ! (AT -1 - s) ! ' 


jV-1 


= -^+i^2( s +i) 

,hi el(tf-1-s)l 


1)' 


JV-l 


= -a +^Z ff 


(A/~- 1) ! 

^M(tf-l-s)! 

" /tÏÎM 

^3 


JV-l 


y? CAMH +^z 


<W- 1)! . VWH 


t 0 s\(N-\-s)\' 


“ïV-i 


J'M JV-1 

J (JV-l)-J J (JV-l)-J 

= “/* +AS?2j^ ^ ï i: + A^2 J i:: ..y J? ï 

j =i J j=0 

= V + AË> (AT- l)/> + Cf " Vs *" 1 " 3 = V + (AT-l) + A£? (/> + (1 - *)) ^ 

j=Ü 

= -/2 2 +Np 2 {N- \) + Np = -ï? + N 2 p 2 - Np 2 + Np = -IX 2 + ï? - Np 2 +A Jp 
= Np(\-p) = Npq 

(7.235) 

L'écart-type étant a 2 = V(k "), nous avons: 

Ô^p) (7.236) 

Voici un exemple de tracé de la fonction de distribution et respectivement de répartition de la loi 
binomiale /?(10,0.5) : 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


352/4839 





























Figure: 7.11 - Loi binomiale (fonction de distribution et de répartition) 

Indiquons que certaines personnes dans les entreprises ramènent le calcul de l'espérance et de 
l'écart-type à l'unité de N. Nous avons alors: 


{ v\ 

E - 

y N) 

Vf*) 

{N} 






(7.237) 


N 


N 


Exemple: 

Sur un échantillon de 100 travailleurs, 25% sont en retard au moins une fois par semaine. L'espérance 
du nombre de retard est alors: 


E{X) = Np = 100 - 0.25 = 25 

,- (7.238) 

er(Jt) = ^(l-p) = A33 
Rapporté à l'unité, cela nous donne: 


E 


a 


0.25 


i 


pV-p) 


N 


0.0433 


(7.239) 


Pour clore concernant notre étude de loi binomiale, nous allons développer un résultat qui nous sera 
indispensable pour construire le test de données appariées de McNemar d'un tableau (carré) de 
contingence (et comme il est carré il est in extenso dichotomique) que nous étudierons dans le chapitre 
de Méthodes Numériques. 

Nous avons besoin pour ce test de calculer la covariance de deux variables aléatoires binomiales 
appariées (raison pour laquelle la covariance est non nulle): 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


353/4839 






























Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


COV I fl,-, «J- I = E I fl,-flj- I - E I «,■ 1 51 «J I (7.240) 


Comme elles sont appariées, cela signifie que: 


«j- +?îj = n 


Pi = 1 - Pi (7.241) 

l-Pi=Pj 


et donc: 


j 

COV I , Mj I = £ I «,-fly i - «p, ■ «p j = E i fl,- flj- I - « J- (1 — p J ) (7.242) 

Maintenant, vient la difficulté qui est de calculer E \ «,■ \. Pour calculer ce terme il n'existe pas à 

notre connaissance d'autres méthodes que de chercher la loi du couple (parfois on peut contourner 
cela). Dans le cas présent il s'agit d'une loi multinomiale (plus précisément: trinomiale) qu'il est d'usage 
d'écrire sous la forme: 




n ! 


?îj \ kj U?î - ?îj — Nj i ! 


Pi P f 11 - - Pi J (7.243) 


Mais que nous noterons temorairement pour la suite afin de condenser l'écriture: 


m! 


£!/!■«-£-/■! 


p k q l r n ~ k ~ l 


fn ' 

\k,l j 


p k q l r n k 1 (7.244) 


Nous avons donc une loi trinomiale car nous avons cherchons le nombre de fois d'avoir l'événement k, 
l'événement / et ni l'un ni l'autre (donc le reste du temps). 

Nous avons alors: 


«! 


jtlilifl-jt-ii! 


E<Jd ■ = ^JdP(H) = X-H 
k, ! k,! 

= + T. Jd • 

JHM) j^rTfcïri k>u>\ 


„k J jî-k-l 
p q r 


a ! 


(7.245) 




p k q l r n - k ~ l 


Si k > 1 et l > 1, nous avons: 


a ! 


a! 


«(« - 1)(m - 2) ! 


kl --- = kl - 

*!/!■;» —A:—/ ■! t(i-l)!i(/-l)!-;»-Ar-/i! (k- !)!(/-1)!. n-k-l i! 


= a (« -1) 


(a-2)! 


(7.246) 


(k- 1) ! (/ — 1) ! ■ n-k-lA 


Maintenant utilisons cette relation dans l'espérance conjointe: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


354/4839 
















Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


5.jy.= y 


n ! 


^1 pi A:!/ ! 1 « - A: - / 1 ! 


Jt n-k-ï 
p q r 


- n {n - 1) ^ 

1 <k 

= n{n- V)pq 


(»- 2 )! 


^ (« - 2 ) ! 




p k q ! r”- k ~ S 


>L!-1 jt-k-1 
p q r 


(7.247) 


Considérons le cas où n vaut 2. Nous avons: 




(«- 2)1 


-p k -W A ^ k ~ l 


1 <km<i<^ k -^ l - i y^- k - l ' y 

V- __ r fc-l J-l-2-fc-I 


p q r 


(7.248) 


0! 


(1 - 1)!(1 - 1 )!( 2 - 1 - 11 ! 


^1-y-y-l-l =1 


et pour n valant 3, le résultat sera aussi 1, et ainsi de suite (nous supposerons afin de simplifier... que 
quelques exemples numériques suffirons au lecteur pour le convaincre de la généralité de cette 
propriété). Nous avons alors: 


E ' kl ' = n (« - ï)pq 


(*- 2 )! 


-DI'»'"*■ 


h\ 


p k l q ! 1 r n ~ k J = n(n- \)pq 


(7.249) 


— \ — 

=1 


Donc au final: 


2 2 
cov i ftj.ftj i = E i i - n pj (1 - pj ) = n(n - 1 )PjPj ~ n PiPj 

= ~ n P\P j 


(7.250) 


5.5. FONCTION BINOMIALE NÉGATIVE 


La loi binomiale négative s'applique dans la même situation que la loi binomiale mais elle donne la 
probabilité d'avoir E échecs avant la R-ème réussite quand la probabilité de succès est p (ou 
inversement la probabilité d'avoir R réussites avant le fs-ème échec quand la probabilité d'échec est p). 

Introduisons cette fonction par l'exemple. Considérons pour cela les probabilités suivantes: 

/^(succès) = 0.2 = p .P(échec) = 0.8 = 1 — p - q (7.251) 

Imaginons que nous ayons fait 10 essais et que nous voulions nous arrêter à la troisième réussite et que 
le 10-ème essai est la troisième réussite! Nous allons noter cela: 

[1 2 3 4 5 6 7 8 9] 10 (7.252) 

Mettons en évidence les réussites (R) et échecs (E): 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


355/4839 















Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

[1 2 3 4 5 6 7 8 9] 10 

(7.253) 

[EEREEEREE] R 

Nous avons donc 7 échecs et 3 réussites. Dans le cadre d'une expérience où les tirages sont 
indépendants, la probabilité que nous avions d'obtenir ce résultat particulier est alors: 

(0.8) 7 (0.2) 3 (7-254) 


Mais l'ordre des succès et échecs dans la partie entre crochets n'a aucune importance. Donc comme 
nous avons 2 succès parmi 9 dans les crochets il vient que la probabilité d'obtenir le même résultat 
indépendamment de l'ordre est alors en utilisant la combinatoire: 



(0.8) 7 (0.2) 3 = 0.0603 


(7.255) 


ce qui correspond donc à la probabilité d'avoir 7 échecs avant la 3ème réussite. Ce qui s'écrit avec 
Microsot Excel 14.0.6123 ou ultérieur en français (7+3=10 essais, 7 échecs dont 3 réussites): 

=LOI.BINOMIALE.NEG.N(7;3;0.2;0)=0.0604 

Généralisons l'écriture antéprécédente notant k le nombre d'échecs, N le nombre total d'essais et p la 
probabilité d'une réussite: 


P(k,N,p) 


N -1 
N-k -1 


q'jF-* 


J 


(7.256) 


Il y a plusieurs écritures possibles cependant car la relation précédente n'est pas très intuitive à mettre 
en pratique comme l'aura peut-être remarqué le lecteur. Ainsi, si nous notons k comme étant le nombre 
de succès et non le nombre d'échecs, nous avons alors (écriture la plus courante selon moi parmi 
d'autres équivalentes) la probabilité suivante d'avoir un certain nombre de réussites avant d'avoir un 
nombre k d'échecs: 


P(k,N,p) 


f N- R 

ç*-l, 


N-k k „kN-k 

q p = C*.! p q 


(7.257) 


donc la comparaison avec la formulation de la loi binomiale démontrée plus haut est alors probablement 
évidente! 


Il est cependant plus courant de noter la relation précédente en faisant disparaître N car pour l'instant 
l'écriture n'est toujours pas très claire. Pour cela, nous notons R le nombre de réussites, E le nombre 
d'échecs,/? la probabilité d'une réussite et il vient alors la probabilité d'avoir R réussites après E échecs 
(c'est beaucoup plus clair...): 




+ 

{Em-S E = 

'E + R-Ÿ 

ç £-1 , 

y f 

K S-l , 


q p 


(7.258) 


Nous la trouvons aussi parfois sous la forme suivante en utilisant explicitement la combinatoire: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


356/4839 
















Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


P(E,N,p) 


E + R-W 
E -1 


q p 


{E+R- 1)! R s = (E + R-W R E 

(E-V)\(E + R-1-(E-V))r P {E-\)\R\. P 


{E + R- 1 )! * £ 

- q P 

R\(E- 1)! 


'E + R-P 

< R J 


q p 


La probabilité cumulée que nous ayons au moins R réussites avant le £-ème échec vient 
immédiatement: 


(7.259) 


N 


Z 

j?=0 


(E + R-î\ 


\ 


E -1 


/ 


?v 


(7.260) 


Remarque : Le nom de cette loi provient du fait que certains statisticiens utilisent une définition d'un 
coefficient combinatoire avec valeur négative pour l'expression de la fonction. Comme c'est une 
forme plutôt rare, nous ne souhaitons pas la démontrer. Il faut savoir aussi que cette loi est aussi 
connue sous le nom de "loi de Pascal" (au même titre que la loi géométrique...) en l'honneur de 
Biaise Pascal et de "loi de Pôlya", en l'honneur de George Pôlya. 


Exemple: 

El. Un contrôle de qualité long terme nous a permis de calculer l'estimateur p des pièces 
non-conformes comme valant 2% à la sortie d'une ligne de production. Nous souhaiterions savoir la 
probabilité cumulée d'avoir 200 pièces bonnes avant que la 3ème pièce défectueuse apparaisse. Avec 
Microsoft Excel 14.0.6123 ou ultérieur en français il vient en utilisant la loi binomiale négative: 

=LOI.BINOMIALE.NEG.N(200;3;0.02;1)=77.35% 

E2. Pour comparer avec la loi binomiale, demandons-nous quelle est la probabilité cumulée de tirer 198 
pièces non-défectueuses parmi 201 avec Microsoft Excel 14.0.6123 ou ultérieur en français: 

=LOI.BINOMIALE.N(198;201;0.98;1)=76.77% 

nous voyons donc que la différence est faible. Au fait la différence entre les deux lois est dans la 
pratique quasiment toujours tellement faible que nous n'utilisons alors que la loi binomiale (mais il faut 
quand même être prudent!). 

Comme à l'habitude, déterminons maintenant la variance et l'espérance de cette loi. Commençons par 
l'espérance d'avoir R réussites avant le C-ème échec sachant que la probabilité d'avoir un échec est p. 
Pour cela nous allons utiliser une astuce très simple et géniale (tout l'art était d'y penser...). Si nous 
reprenons notre exemple de départ: 

[1 2 3 4 5 6 7 8 9] 10 

, , (7-261) 

[rrerrrerr] e 

et que nous le réécrivons sous la forme suivante: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


357/4839 
















Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

[1 2 3 4 5 6 7 8 9 10] 


;RJ^E. R R ^ R E R R E , 

JTj JTj JT 3 


(7.262) 


Nous remarquons alors que la troisième réussite R de la première écriture peut être décomposée en la 
somme de trois variables aléatoires géométriques telle que: 

R = Jlj + X 2 +... + X r j (7.263) 


Avec dans le cas du présent exemple particulier « = 3 correspondant au fait à E = 3 ■ Donc en toute 
généralité la somme de n variables aléatoires géométriques donne toujours une loi binomiale négative si 
la probabilité p est égale pour chaque variable géométrique! Bref... comme nous avons démontré 
l'expression de l'espérance et la variance de la loi Géométrique comme étant: 

E{X) = - V (X) = = -^ ( 7 . 264 ) 

P P P 


Puisque les variables aléatoires sont de même paramètres et indépendantes il vient alors pour 
l'espérance de la loi binomiale négative: 


S(S) = S{X 1+ X 2 +... +X n ) = E(^)+E(^r 2 ) +...+E(X„) 

= rtE(X) = n--=E-- 
P P 


(7.265) 


Et donc pour la variance de la loi binomiale négative: 


V(R)=tT{X l +X 2 +... + X n )=tr(X l )+V(X 2 ) + ...+tr(X n ) 

= nV{X) = n l -^- = E\ 

P P 


(7.266) 


Exemple: 

Quelle est l'espérance du nombre de pièces bonnes que nous aurons avant la troisième pièce 
non-conforme, sachant que la probabilité d'une pièce non-conforme est de 2%? 

£(*)=-= ^ = 150 (7.267) 

p 2% 


et pour la variance: 


a = 



[, (1-2%) 

( 2%) 2 


85.732 (7.268) 


Voici un exemple de tracé de la fonction de distribution et répartition pour la fonction binomiale 
négative de paramètres P(R,E,p ) = P(3,E, 0.6) basé sur l'exemple du début mais avec comme seule 
différence d'avoir pris probabilité de réussite de 60% au lieu de 20%: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


358/4839 















Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 



Figure: 7.12 - Loi binomiale négative (fonction de distribution et de répartition) 


La distribution ci-dessus est tronquée à 9 mais continue théoriquement à l'infini. Ce qui différencie 
particulièrement la loi binomiale, géométrique de la loi binomiale négative sont les queues de la 
distribution. 


5.6. FONCTION HYPERGÉOMÉTRIOUE 


Nous considérons pour approcher cette fonction un exemple simple (mais guère intéressant dans la 
pratique) qui est celui d'une urne contenant n boules dont m sont noires et les autres m 'blanches (pour 
plusieurs exemples concrets utilisés dans l'industrie se reporter au chapitre de Génie Industriel ou de 
Méthodes Numériques). Nous tirons successivement, et sans les remettre dans l'urne, p boules. Quelle 
est la probabilité que parmi ces p boules, il y en ait k qui soient noires (dans cet énoncé l'ordre du tirage 
ne nous intéresse donc pas!). 

Nous parlons souvent de "tirage exhaustif' avec la loi hypergéométrique car contrairement à la loi 
binomiale, la taille du lot qui sert de base au tirage va apparaître dans la loi. Raison pour laquelle la loi 
hypergéométrique tend vers les valeurs de la loi Normale lorsque la taille du lot est petite. 


Remarque : Cela équivaut à l'étude non ordonnée d'un tirage sans remise (cf. chapitre de 
Probabilités) avec contrainte sur les occurrences appelé parfois "tirage simultané". Nous utiliserons 
souvent cette fonction dans le domaine de la qualité ou de la fiabilité où les boules noires sont 
associées à des éléments avec défauts et les blanches à des éléments sans défauts. 


Les p boules peuvent être choisies parmi les n boules de C™ façons (représentant donc le nombre de 
tirages différents possibles) avec pour rappel (cf. chapitre de Probabilités): 


C* 


«! 

pj pi p\-(n~p)\ 


(7.269) 


Les k boules noires peuvent être choisies parmi les m noires de C“ façons. Les p-k boules blanches 
peuvent être elles choisies de C™façons. Il y a donc Z™ tirages qui donnent k boules noires et 
p-k boules blanches. 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


359/4839 






















Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

La probabilité recherchée vaut donc (nous en verrons une autre formulation possible dans le chapitre 
de Génie Industriel): 


m\ 




P{n,p,m,k) = H{k) = 


,-ïm ,-TH-m 

'^p-k 

C n 


k ! (m - k) ! (p - k) ! ( (n - m) - (p - k) ) ! 
n\ 


(7.270) 


p\(n-p)\ 


et est dite suivre une "fonction Hypergéométrique" (ou "loi Hypergéométrique") et peut être obtenue 
heureusement de manière directe dans Microsoft Excel 11.8346 avec la fonction 
LOI.HYPERGEOMETRIQUE( ). 

Exemples: 

El. Nous souhaitons mettre en production un petit développement informatique de ÎO'OOO lignes de 
code (n). Le retour d'expérience montre que la probabilité de défaillance est de 1 bug pour l'OOO lignes 
de code (soit 0.1% de ÎO'OOO lignes) ce qui correspond à valeur de m. 

Nous testons environ 50% des fonctions du logiciel au hasard avant l'envoi au client (soit l'équivalent 
de 5'000 lignes de code correspondant à p). La probabilité d'observer 5 bugs (k) est avec 
Microsoft Excel 11.8346: 


= LOI.HYPERGEOMETRIQUE(A:;/»;«î;n) 

= LOI.HYPERGEOMETRIQUE(5;5000;0.1%* 10000; 10000)=24.62% 

E2. Dans une petite production unique d'un lot de l'OOO pièces dont nous savons que 30% en moyenne 
sont mauvaises à cause de la complexité des pièces par retour d'expérience d'une fabrication 
précédente similaire. Nous savons qu'un client va en tirer 20 au hasard pour décider d'accepter ou de 
rejeter le lot. Il ne rejettera pas le lot s'il trouve zéro pièce défectueuse parmi ces 20. Quelle est la 
probabilité d'en avoir exactement 0 de défectueuse? 

=LOI.HYPERGEOMETRIQUE(0;20;300;1000)=0.073% 

et comme on exige un tirage nul, le calcul de la loi hypergéométrique se simplifie en: 


700 699 698 697 681 

ÏÔÔÔ 999 998 '997 ' ' 98Ï 


0.073% (7.271) 


Il n'est pas interdit de faire le calcul direct de l'espérance et de la variance la fonction hypergéométrique 
mais le lecteur pourra sans trop de peine imaginer que ce calcul va être... relativement indigeste. Alors 
nous pouvons utiliser une méthode indirecte qui de plus est intéressante. 

D'abord le lecteur aura peut-être, même certainement, remarqué qu'au fait l'expérience de la loi 
hypergéométrique est une série d'essais de Bernoulli (sans remise bien entendu!). 

Alors, nous allons tricher en utilisant dans un premier temps la propriété de linéarité de l'espérance. 
Définissons pour cela une nouvelle variable correspondant implicitement au fait à l'expérience da la 
fonction hypergéométrique (k essais de Bernoulli de suite!): 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


360/4839 
















Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

ifc 

X='£X i (7.272) 
i=l 

où X i représente la réussite d'obtenir au z-ème tirage une boule noire (soit 0 ou 1). Or, nous savons que 
pour tout i la variable aléatoire X i suit une fonction de Bernoulli pour laquelle nous avons démontré 
lors de notre étude de la loi de Bernoulli que E{X i ) = p . Dès lors, de par la propriété de linéarité de 
l'espérance nous avons: 


ifc 


E{X) = E 




0=1 


= k- 


(7.273) 


Or, dans l'essai de Bernoulli,/? est la probabilité d'obtenir l'élément recherché (pour rappel...). Dans la 
loi hypergéométrique ce qui nous intéresse est la probabilité d'avoir une boule noire (qui sont en 
quantité m, avec donc m 'boules blanches) par rapport à la quantité totale de boules n. Et le rapport 
nous donne évidemment cette probabilité. Ainsi, nous avons: 


yyi y?i 

E{X)=k-—— = k- (7.274) 
m'+m n 


où k est le nombre de tirages (attention à ne pas confondre avec la notation de l'énoncé initial où il était 
noté par la variable p). Cette moyenne donne donc le nombre moyen de boules noires lors d'un tirage 
de k boules parmi n, dont m sont connues comme étant noires. 

Pour déterminer la variance, nous allons utiliser la variance de la fonction de Bernoulli et la relation 
suivante démontrée lors de l'introduction de l'espérance et de la covariance au début de ce chapitre: 

¥(X + Y) = V(X) + V{Y) + 2 cov(JST, Y) = ¥(X) + V(Y) + 2 (E(X ■ Y) - E{X)E{Y)) (7.275) 


ifc 

Dons en rappelant que nous avons X = ^X i il vient: 

i=i 


V 


fi fc \ 

v=l 


s+ 2 Z { B ( X i x s>-Z(X:)E(X.)) (7.276) 
1=1 l<i<j<n 


Or, pour la loi de Bernoulli, nous avons: 


V(X) = p-q 


m m' 
m'+ m m'+m 


m-m' 
(jn '+ m) 


m ■ ' 


« 


2 


(7.277) 


Alors nous avons déjà: 


Z 


i=i 


nx t ) = k 


m-m' 

2" 

[m '+ m) 


— k 


mm 1 


n 


2 


(7.278) 


Ensuite, nous avons facilement: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


361/4839 
















Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

E(X,)E(X) = -= f-^-1 (7-279) 

m+mm+m \m+m) 


Le calcul de A (A) AL) nécessite une bonne compréhension des probabilités (c'est un bon rappel!). 

L'espérance E(X i X J -) est donnée (implicitement) par la somme pondérée des probabilités que deux 

événements aient lieu en même temps comme nous le savons. Or, nos événements sont binaires: soit 
c'est une boule noire (1) soit c'est une boule blanche (0). Donc tous les termes de la somme n'ayant pas 
deux boules noires consécutivement seront nuis! 

Le problème est alors de calculer la probabilité d'avoir deux boules noires consécutives et celle-ci 
s'écrit donc: 

P(X t X =1)=f((Jf,=1)n(Jf,=1))=f(X,=l)f, | , 1 (JT =1)= ” m ~\ (7.280) 

3 ' 3 3 1 3 m+m (m+m) -\ 


Donc nous avons finalement: 


EiXjXj) = 


m m -1 
m'+m (m'+m)~ 1 


(7.281) 


Soit: 


cov(A;.,A,) = E(X, ■ A,) -E(X i )E(X J ) = 


m 


m -1 


m'+m (m'+m )-1 


m 


\m '+mj 


(7.282) 


—m ■ m 


[m'+m} (m'+m- 1) 


Finalement: 


V[X) = j^V(X i )+2 ± {E(X i -X j )-E(X i )E(X j )] 
1=1 1<IC :j<n 

jfc 

Z i 


mm 

— Ar-— + 2 


—m ■ m 


(m '+ m ) 2 [m '+ mf (m'+m- 1) ]<i<j< B 


, mm 
- k - - + 2 


-m ■ m 


(k-\)k 


(m'+m) 2 [m'+m} 2 (m'+m -1) 2 

k - mm '(m'+m - 1) - m ■ m 'À7(Ar — 1) km - m'(m '+ m -1 - £ +1) 


(7.283) 


2 

(. m '+ m) (m'+m- 1) 


2 

[m'+m) (m'+m- 1) 


k - mm '(m '+m- k) , m m' m'+m-k , m'+m-k 

- 5 - = k ~ -;-;- ~ =k P<ï— - - 

[m'+m) (m'+m-Y) m+m m+m m + m-l m+m-l 


où nous avons utilisé le fait que: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


362/4839 
























Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


Z i:ov C^’^) ( ? - 284 ) 

i<3 


est composé de: 


C\ 



k(k-V) 

2 


(7.285) 


termes puisqu'il correspond au nombre de façons qu'il y a de choisir le couple (i, j) avec i < j . 


Donc finalement: 


V{X) = kpq?-^ (7.286) 


(7.287) 

V n -1 

Nous voyons qu'il s'agit du même écart-type que la loi binomiale, à la différence d'un facteur qui est 
noté: 


jpc = 



(7.288) 


que l'on retrouve assez souvent en statistiques et qui est appelé "facteur de correction de population" ou 
en anglais "finite population correction factor". 

Voici un exemple de tracé de la fonction de distribution et répartition pour la fonction 
Hypergéométrique de paramètre {n, p,m ,£) = (10, 6,5,k) : 


o» 



tb o 

Figure: 7.13 - Loi hypergéométrique (fonction de distribution et de répartition) 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


363/4839 
























Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


Démontrons que la loi Hypergéométrique tend vers une loi binomiale puisqu'il en est fait usage de 
nombreuses fois dans différents chapitres du site (et particulièrement le chapitre de Génie Industriel). 


Pour cela, décomposons: 


P(n,p,m,k) = - (7.289) 

C p 


Il vient alors: 


-1 

Ci 

| 1 

1 

f m ! ^ 

(n- m)\ 

^ A: ! (m - k) \j 

{ (p-k)\((p-m)-(p-k))\. 

Cl «I 1 



m\ 


■yp\(n-p)\ 


p\(n-p)\ 


k\(m - k) ! (p - k) ! ((« - m) - (p - £)) ! « ! 

p\ m! ( n-m)\ (n-p)\ 

k\(p - k) ! (m - k) ! ((m - m) - (p - £))! m! 

ç P ml (n-m)\ (n-p)\ 

* (m -£) ! ((« - m) - (p -£)) ! ni 


(7.290) 


Pour le deuxième terme: 

ml 


1-2-3 -...m 


■ = m-(m-V) ■... ■ (m-k + î) (7.291) 


(m - k) ! 1-2-3 ■ ...■ (m-k) 

Pour m —>+oo tous les termes sont alors de l'ordre de m. Nous avons alors: 

m-(m-V) ■■ (m-k + V) = m k (7.292) 

Pour le troisième terme un développement identique en tous points au précédent permet d'obtenir: 

(»-«)! , 

- (n - mf (7.293) 


{(n-m)-(p-k))l 


Idem pour le quatrième terme: 




n ! 


= n p (7.294) 


En conclusions nous avons: 


r-tm r-tn-m i- , , 

^ c p-k _ m (n - mf 


p 


(7.295) 




Changeons d'écriture en posant p (le nombre d'individus tirés) comme étant N. Il vient alors: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


364/4839 



























Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


k m \N-k 

Cfc -N-k _ çN m {?î — f?î) 
k n N 


(7.296) 


Faisons un autre changement d'écriture en notant b les boules noires (black) et w les boules blanches 
(yvhite). Il vient alors: 


- '-k — 


C” 


N 


n 


= cf—— (7 - 297) 


Enfin, notons p la proportion de boules noires et q celle de boules blanches dans le lot n. Il vient alors: 

V* , \bJ-k 


k ^N-k rib? ( n P) ( Wl ?) nN ( ,■ -JV-ife . -N 


rin-p r-fn-nf 

° - -N-k _ q. 
C n * 


N 


33 




(7.298) 


— O? ^ 33 33 33 — O? 


Nous retrouvons donc bien la loi binomiale!! En pratique, il est courant d'approximer la loi 
hypergéométrique de paramètres par une loi binomiale de paramètres dès que le rapport nombre 
d'individus tirés sur le nombre total d'individus est inférieur à 10% (c'est-à-dire lorsque l'échantillon est 
10 fois plus petit que la population). Il s'ensuit que la loi hypergéométrique tend aussi (comme nous le 
démontrerons plus loin) vers une loi Normale lorsque la population tend vers l'infini et que l'échantillon 
est petit. 

5.7. FONCTION MULTINOMIALE 


La loi multinomiale (appelée ainsi car elle fait intervenir plusieurs fois le coefficient binomial) est une 
loi applicable à n événements distinguables, chacun ayant une probabilité donnée, qui surviennent une 
ou plusieurs fois et ce de façon non nécessairement ordonné. Il s'agit d'un cas fréquent dans les études 
marketing et qui nous serta utile pour construire le test statistique de McNemar beaucoup plus loion. 
Nous retrouvons également cette loi en finance quantitative. 

Plus techniquement, considérons l'espace des événements Q = (1,muni d'une probabilité 
P{{}\) = Pi ,i = 1,. Nous tirons n fois de suite avec remise un élément de Q avec la probabilité 
p { ,i = 1 ,. Quelle est donc la probabilité d'obtenir de manière non nécessairement ordonnée 
l'événement 1, Æj fois, l'événement 2, k 2 fois et ce sur une suite d'un tirage de n éléments. 


Remarque : Cela équivaut à l'étude d'un tirage avec remise (cf. chapitre de Probabilités) et 
contraintes sur les occurrences. Donc sans contraintes nous verrons par l'exemple que nous 
retombons sur un tirage avec remise simple. 


Nous avons vu dans le chapitre de Probabilités, que si nous prenons un ensemble d'événements ayant 
plusieurs issues, alors les différentes combinaisons de suites que nous pouvons obtenir en prenant p 
éléments choisis parmi n est: 


n ! 

P !' C» " p) ! 


(7.299) 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


365/4839 


















Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

Il y a donc: 



n ! 

Ai !(« - Aj ) ! 


(7.300) 


façons différentes d'obtenir Aj fois un certain événement. Soit une probabilité associée de: 

P(n,K> =C%pSl"- h =C^0-A) 

Maintenant, intervient la particularité de la loi multinomiale!: il n'y a pas d'échecs contrairement à la loi 
binomiale. Chaque "pseudo-échec" peut être considéré comme un sous tirage de k 2 parmi les n - ^ 

éléments restants. 


Ainsi le terme: 


s'écrira sur l'ensemble de l'expérience si nous considérons un cas particulier limité à deux types 
d'événements: 

c£ y y : = c\ y ( y y ) (7.302) 

avec donc: 


- % y- 

c,, =- 77 -T-C ( 7 - 303 ) 

qui donne le nombre de façons différentes d'obtenir k 2 fois un second événement puisque dans 
l'ensemble de la suite, de n éléments déjà Aj ont été tirés ce qui fait qu'il n'en reste plus que n - ^ sur 
lesquels nous pouvons obtenir les k 2 voulus. 

Ces relations nous montrent donc qu'il s'agit d'une situation où chaque probabilité d'événement est 
considérée comme une sous loi binomiale (d'où son nom aussi...). 

Alors nous avons dans le cas particulier de deux séries d'uplets: 

«! \ K 

= — - - - 

*11*2 !(»“*!-*a) ! 


et comme: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


366/4839 










Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


—Aj - k} = —fl (7.305) 


il vient: 


p_ w! 1 fc, = „*i„_Jt, 


iAft' =■ 


jtJAjIO! Aï ! 

et nous voyons que la construction de cette loi impose donc que: 

Z Pi = ^ Z!' = n (7.307) 


Pl P2 (7.306) 


Ainsi, par récurrence nous avons la probabilité P recherchée appelée "fonction Multinomiale" (ou "loi 
Multinomiale") et donnée par: 




() 



>>] , 

z* 

! 

p= n ■ 

m 

efN- 

V 1=1 J 

m 

-nW 4 

m 

! !=1 

n*-' 

2=1 

i=i 


2=1 



(7.308) 


dans le logiciel Microsoft Excel 11.8346, le terme: 


« 

Z* I 


\ Z=1 / 

m 


rw 


(7.309) 


appelé "coefficient multinomial" est disponible sous le nom de la fonction MULTINOMIALE( ) dans la 
version française. Dans la littérature nous trouvons également ce terme parfois sous les formes 
respectives suivantes: 


^+^+... + 0 
< ^1 » ^2 ’ ■ ■ ■ ’ Kn J 


m 


^1,^2’■ ■ ■’K71/ 


(7.310) 


Démontrons que la loi multinomiale est bien une loi de probabilité (car nous pourrions en douter...). Si 
c'est bien le cas, la somme des probabilités doit être comme nous le savons, égale à l'imité. 

Démonstration: 

Rappelons que dans le chapitre de Calcul Algébrique nous avons démontré que (théorème binomial): 

{x + y) n =j^C^y n ~ k (7.311) 

,t=ü 


Faisons maintenant un petit peu de notation: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


367/4839 




















Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


(*i+* 2 r = z c *"* 1 S""' i = 7: 


n ! 




ky =0 


£0*1 '(«-^î l! 


-*1 “2 


(7.312) 


et cette fois-ci un changement de variables: 




x 2 - ^ Z I Z I *1 *2 
Ai=0 *i=0N !j V 


(7.313) 


Cette dernière relation (qui est un cas à deux termes du "théorème multinomial") va nous être utile pour 
démontrer que la loi multinomiale est bien une loi de probabilité. Nous prenons donc le cas particulier 
avec deux groupes de tirage: 


P = 


n ! 


fr fc «! fc k 2 


n*;! 

1=1 

ce qui s'écrit aussi de par la construction de la loi multinomiale: 

p= w! 


(7.314) 


A) ! ' n - Atj i ! 


P\ P2 


(7.315) 


et donc la somme doit être égale à l'unité telle que: 


~V 

, Pl P2 - 1 


!(« —*11! 


(7.316) 


pour vérifier cela nous utilisons le théorème multinomial montré précédemment: 


, « A n - K ( H A) 

P 1 +P 2 ) =JL~ - —<P\P 2 (7-317) 


!(«-£} l! 


Or, comme par construction de la loi multinomiale la somme des probabilités est unitaire, nous avons 
bien: 


'P 1 +P 2 f 


D"=1= T 


n ! 


^= 0^1 l! 


PÏP ( P h) 


(7.318) 


□C.Q.F.D. 


Exemples: 

El. Nous lançons un dé non-pipé 12 fois. Quelle est la probabilité que les six faces apparaissent le 
même nombre de fois (mais pas nécessairement consécutivement!) soit deux fois pour chaque: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


368/4839 














Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


P = ' 


n ! 


n^-Aniïl - 


12 ! 


= 0.34% 


nv 

2=1 


i=l 


H2! 

2=1 


2=1 


2 e 5 12 


où nous voyons bien que m correspond au nombre de groupes de réussites. 


E2. Nous lançons un dé non-pipé 12 fois. Quelle est la probabilité qu'une seule et unique face 
apparaisse 12 fois (donc que le "1" apparaisse 12 fois de suite, ou le "2", ou le "3", etc.): 


P = - 


n ! 


m 

m' 

!=1 


A Aj 12! 

r [p? = -j— 


1 


2=1 


•n c 


ni2i 

ï=i 


i=i 


(7.320) 


Nous retrouvons donc avec ce dernier exemple un résultat connu de la binomiale. 
5.8. FONCTION DE POISSON 


Pour certains événements forts rares, la probabilité p est très faible et tend vers zéro. Toutefois la valeur 
moyenne « ' P tend vers une valeur fixe lorsque n tend vers l'infini. 

Nous partirons donc d'une distribution binomiale de moyenne f* = « ' P que nous supposerons finie 
lorsque n tend vers l'infini. 


La probabilité de k réussites lors de n épreuves vaut (loi Binomiale): 

PM- 




k 


p*'$*-*' (7.321) 


En posant p = m/n (où m est temporairement la nouvelle notation pour la moyenne selon P = 
cette expression peut s'écrire: 


n 


n 


n ! 



m 


1 - — 


n—h 


(7.322) 


£!(« -£)!V«/ \ n J 

En regroupant les termes, nous pouvons mettre la valeur de P ( k ) 


m [ | _ m 
£! I « 


n ! 


(*-£)!«* 1- — 


m 


sous la forme: 


(7.323) 


I n I 

Nous reconnaissons que, lorsque n tend vers l'infini, le deuxième facteur du produit a pour limite e ~^. 

Quant au troisième facteur, puisque nous nous intéressons aux petites valeurs de k (la probabilité de 
réussite est très faible), sa limite pour n tendant vers l'infini vaut 1. 

Cette technique de passage à la limite est parfois appelée dans ce contexte: "théorème limite de 
Poisson". 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


369/4839 


















Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

Nous obtenons ainsi la "fonction de Poisson" (ou "loi de Poisson"), appelée également parfois "loi des 
événements rares", donnée donc par: 



(7.324) 


qui peut être obtenue dans Micrsooft Excel 11.8346 avec la fonction LOI.POISSON( ) 
pratique et la littérature spécialisée est souvent notrée par la lettre u. 

Il s'agit bien d'une loi de probabilité puisqu'en utilisant les séries de Taylor (cf. chapitre 
Séries), nous montrons que la somme des probabilités cumulées est bien: 


-mo 


2 



-Ko Je 

= y iL 
£o*l 


e M S M =1 (7.325) 


et qui dans la 

de Suites Et 


Remarque : Nous retrouverons fréquemment cette loi dans différents chapitres du site comme par 
exemple lors de l'étude du Génie Industriel en maintenance préventive ou encore dans le même 
chapitre lors de l'étude des théories des files d'attentes (le lecteur peut s'y reporter pour un exemple 
intéressant et pragmatique) et enfin dans le domaine de l'assurance. 


Voici un exemple de tracé de la fonction de distribution et répartition pour la fonction de Poisson de 
paramètre j = 3 : 



Figure: 7.14 - Loi de Poisson (fonction de distribution et de répartition) 


Cette distribution est importante car elle décrit beaucoup de processus dont la probabilité est petite et 
constante. Elle est souvent utilisée dans la "queing theory" (temps d'attente), test d'acceptabilité et 
fiabilité, et contrôles statistiques de qualité. Entre autres, elle s'applique aux processus tels que 
l'émission des quanta de lumière par des atomes excités, le nombre de globules rouges observés au 
microscope, le nombre d'appels arrivant à une centrale téléphonique. La distribution de Poisson est 
valable pour de nombreuses observations faites en physique nucléaire ou corpusculaire. 

L'espérance (moyenne) de la fonction de Poisson est (nous utilisons la série de Taylor de 
l'exponentielle): 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


370/4839 



























Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 




+cù 


fi= E{k) = ^k-P l =JV — -e^ = e~ it -u^ t — - = e~*'We M = U ( 7 - 326 ) 


k-t? 


S\-c? 


k\ trc^-i)! 

et donne le nombre moyen de fois que l'on obtiendra l'issue souhaitée. 

Ce résultat peut paraître déroutant.... la moyenne s'exprime par la moyenne??? Oui il ne faut 
simplement pas oublier que celle-ci est donnée au début par: 


= p (7.327) 


Remarque : Pour plus de détails le lecteur peut aussi se reporter à la partie concernant les 
"estimateurs" dans le présent chapitre. 


La variance de la fonction de distribution de Poisson est quant à elle donnée par (en utilisant à nouveau 
les séries de Taylor): 


-Ko +00 k 

= V{k) = Zt* - = Z [* - i*f ^re~ M 

k=0 jfe=Ü 


jfe=Ü 

-K» k -K» k -K» k 

= Tit 2 ^-T2 2 u 

Ü *1 £ *1 


k\ 

.Jfc 


Æ=0 


+Z> : 

^ Jri 

jfe=Ü 


4oo jfc +:o 

= Z* 2 tt^-2^Z 

î-=n ^ ! l—m 




.ifc-i 


jfc=0 

-Ko k 

a n 


D! 




+oo fc 

+^f 2 Z— 

^ il 


k =0 


= Z* 2 |r^-2^Z 


A*- 1 


k=0 




+^ i = 2 ^ 4 e "'‘ _2 ^ +; ' 2 

fc=0 


-Ko ^-1 
= — 


= 


4oo 


s=k 


ue-^s+\)ü--f? 
- 1 ^ S! 


= 


^4-oo j 4oo j \ 

“ Z^+Z^- ~ 

\i=0 5:1 i=C s! j 


-Ko j-1 

V J 


^(s-1)! 




= ^ (/^V)- f? = et + fje-W -f?=f? + fi-f? = 


toujours avec: 

fl = n-p (7.329) 

Le fait important que pour la loi de Poisson nous ayons la variance qui soit égale à l’espérance est 
appelé "propriété d'équidispersion de la de Poisson". Il s'agit d'une propriété souvent utilisée dans la 
pratique comme indicateur pour identifier si des données (à support discret) sont distribuées selon une 
loi de Poisson. 

Les lois théoriques de distributions statistiques sont établies en supposant la réalisation d'un nombre 
infini de mesures. Il est évident que nous ne pouvons en effectuer qu'un nombre fini N. D'où la 
nécessité d'établir des correspondances entre les valeurs utiles théoriques et expérimentales. Pour ces 
dernières nous n'obtenons évidemment qu'une approximation dont la validité est toutefois souvent 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


371/4839 



















Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

admise comme suffisante. 

Maintenant démontrons une propriété importante de la loi Poisson dans le domaine de l'ingénierie que 
nous appelons la "stabilité par l'addition". L'idée est la suivante: 

Soit deux variables aléatoires indépendantes X et Y de loi de Poisson de paramètre respectif ^ et p. 
Nous voulons vérifier que leur somme est aussi une loi de Poisson: 


X + Y=Px +m (7.330) 

Voyons cela: 

k k 

P(X + Y = k) = T J p [ i X = i<r^>Y = jfc-1.] = '£PiX = i)Pi Y = k-\) (7.331) 

1=0 3=0 


car les événements sont indépendants. Nous avons alors: 


P(X+Y = k) = T) Pi X = I \P[ Y = k- 1 
1=0 

') * il . . . 


Je ji„..k-i-p 
A e p e ^ 


i=0 


i! (£-i)! 


(7.332) 


k\ ”3* ! (£-j)! 


Or, en appliquant le théorème binomial (cf. chapitre Calcul Algébrique): 

i-l . , . k 

.^1 ^ 

2=0 


k 


jwo^C^-O! 


A i p k ! = S C k ?l p k i = . A + p * (7-333) 


Donc au final: 


Je e~^ + ^ 

P{X + Y = k) = \ A + fÂ\ - 

jt! 


(7.334) 


et donc la loi de Poisson est bien stable par l'addition. 

5.9. FONCTION DE GAUSS-LAPLACE/LOI NORMALE 


Cette caractéristique est la plus importante fonction de distribution en statistiques suite au résultat d'un 
théorème connu appelé "théorème central limite" qui comme nous le verrons, permet de démontrer 
(entre autres) que toute suite de variables aléatoires indépendantes de même loi ayant une espérance et 
un écart-type fini et non nécessairement égales converge vers une fonction de Gauss-Laplace (loi 
Normale). 

Il est donc très important de focaliser particulièrement son attention sur les développements qui vont 
être faits ici! 

Partons d'une fonction Binomiale et faisons tendre le nombre n d'épreuves vers l'infini. Si p est fixé au 
départ, la moyenne fi = n- p tend également vers l'infini, de plus l'écart-type n- p-q tend également 

[Vincent ISOZ] | http://www.sciences.ch] | Page: 


372/4839 












Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

vers l’infini. 


Remarque : Le cas où p varie et tend vers 0 tout en laissant fixe la moyenne U ~ P ayant déjà été 
étudié lors de la présentation de la fonction de Poisson. 


Si nous voulons calculer la limite de la fonction Binomiale, il s'agira donc de faire un changement 
d'origine qui stabilise la moyenne, en 0 par exemple, et un changement d'unité qui stabilise l'écart-type, 
à 1 par exemple. 

Voyons tout d'abord comment varie P x (k) en fonction de k (nombre de réussites) et calculons la 
différence: 


P x (k + \)-P x (k) 


fl 

£+1 H-.t-l 

f \ 

fl 

.(:■ M-.t 

f > 

fl 

— : 
1 

R 

in ~ k)p 
{k + \)q 

k + 1 

j 

p q 

k 

V J 

p q - 

k 

V i 

p q 


= W 


np ~ k ~ q 

(k+l)q 


(7.335) 


Nous en concluons que P x (k) est une fonction croissante de k, tant que n i p-k-q est positif (pour n, 

p et q fixés). Pour le voir il suffit de prendre quelques valeurs (du membre de droite de l'égalité) ou 
d'observer la distribution graphique de la fonction Binomiale en se souvenant bien que: 

£t = n'P (7.336) 

Comme q < 1 il est par conséquent évident que la valeur de k voisine de l'espérance de la loi Binomiale 
U = n i p constitue le maxima de P x (k). 

D'autre part la différence P x (k + 1) - P x (k) est le taux d'accroissement de la fonction P x (k ). Nous 
pouvons alors écrire: 

*?,(*) _ + 3 

At (*+!)-* 


comme étant la pente de la fonction. 

Définissons maintenant une nouvelle variable aléatoire telle que sa moyenne soit nulle (variations 
négligeables) et son écart-type unitaire (une variable centrée-réduite en d'autres termes). Nous avons 
alors: 


k - np 

* = -j= 

«Jnpq 

Nous avons alors aussi avec cette nouvelle variable: 

A _ (k +1) - np k-np _ [(£ + 1) -np}- {k-np) 

Ax — -j - —~ =- j -- (7.338) 

^npq yjnpq ^jnpq 

Appelons F(x) l'expression de P x (k) calculée en fonction de la nouvelle variable de moyenne nulle et 

[Vincent ISOZ] | http://www.sciences.ch] | Page: 


373/4839 




























Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

d'écart-type unitaire dont nous recherchons l'expression quand n tend vers l'infini. 
Reprenons: 


Ak 


ftp-k-q 

(k+\)q 


£(*) = 


-(k-np)-q 

{k+\)q 


PM 


(7.339) 


Afin de simplifier l'étude de cette relation quand n tend vers l'infini et k vers l'espérance f* ~ n ' P , 
multiplions des deux côtés par npq / yjnpq ■ 


A- p „ (k) npq 
Ak J npq 


-JtzÆlZl ™Lp„(k) 

(£ + 1)# «Jnpq 


(7.340) 


Réécrivons le terme de droite de l'égalité. Il vient alors: 


- [-»-«>-«]» J, w 
(£ + 1) J npq (k + V)-Jnpq 


(7.341) 


Et maintenant réécrivons le terme de gauche de la relation antéprécédente. Il vient: 

ÀP„(£) npq _ A.P (Je) npq __ AF^ (£) _ npq 

Ak ^jnpq [(k + 1) - k ] .Jnpq {[ (k + 1) - np ] - (k - np)} *Jnpq 

àPJk) _ npq _ APjk) _ APJk) 

{{(k +1) ~np]~ (k - np)} -Jnpq*Jnpq {[(£ + 1) - np] - (k-np)} Ax 

pipq pipq 

Après un passage à la limite pour n tendant vers l'infini nous avons dans un premier temps pour le 
dénominateur du deuxième terme de la relation antéprécédente: 


\-{k-np)-q'\np 
(k + V).Jnpq 




(7.342) 


la simplification suivante: 


(k+V)Jnpq = kJnpq (7.343) 

H-^+OO 


Donc: 


-[{k-np) + q}np k-np qnp 

— ?» (P) = ~ — i= npP» (k) - ■== P„ (k) (7.344) 


k-Ji 


ftpq 


k^Ji 


npq 


k-Ji 


npq 


et dans un second temps, tenant compte du fait que les valeurs de k considérées se trouvent alors au 
voisinage de l'espérance np, nous obtenons: 


■np np k 

rnp = 


■ np 


■ np 


k«Jnpq * 


= x 


(7.345) 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


374/4839 












































Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

et: 


qttp __ qftp _ q _ 
k^jiïpq ttp*jttpq *Jttpq 


(7.346) 


Donc: 


- [ (k - ?tp) + q ] ?tp 


k,j< 


npq 


- - X 


(7.347) 


et comme: 


P n (k) = ^0) (7.348) 

où F(x) représentera pour les quelques lignes qui vont suivre, la fonction de densité lorsque n tend vers 
l'infini. 

Nous avons finalement: 


^^-=~xF(x) (7.349) 

dx 

Cette relation peut encore s'écrire en réarrangeant les termes: 

—-— dF(x) = -xdx (7.350) 

F(x) 

et en intégrant les deux membres de cette égalité nous obtenons (cf. chapitre de Calcul Différentiel Et 
Intégral): 

ln{F{x)) = + c* (7.351) 

La fonction suivante est une des solutions de la relation précédente: 

F(x) = ‘s~^ (7 ' 352) 

Effectivement: 



f j? ^ 


^ ^ > 


f r 2 ") 

ln 

1 01 

= ln(^)+ln 

e 2 

\ J 

= c te + 

X 

l~J 



(7.353) 


La constante est déterminée par la condition que: 


jFO)üfr (7.354) 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


375/4839 






















Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

qui représente la somme de toutes les probabilités, vaille 1. Nous pouvons montrer pour cela que: 


Démonstration: 

Nous avons: 


À = 



(7.355) 


-Ko _* J 

| e 2 dx 

-0Q 



-0Q 


V2 J e~ s dz (7-356) 

-OO 


Donc concentrons-nous sur le dernier terme de l'égalité. Ainsi: 

-hD -Kil' 

dx = 2 J* e - * dx (7.357) 



puisque g,-* 2 est une fonction paire (cf. chapitre d'Analyse Fonctionnelle). Écrivons maintenant le carré 
de l'intégrale de la manière suivante: 


I 2 




(7.358) 


et faisons un changement de variable en passant en coordonnées polaires, dès lors nous faisons aussi 
usage du Jacobien dans ces mêmes coordonnées (cf. chapitre de Calcul Différentiel Et Intégral): 


r = 4 lim 

Æ->-K» 


|| é? y rdrd .ÿ 


fxt2R 


= 4 lim 


| | e ^ rdrdfi 


\ o o 


,?r 

= 4— lim 
2 Jw -Ko 


fR 2 ^ 

I s rdr 

Vo 


= 2tt 


1 _> r ^ 

2 


-Ko \ 


l\ 


(7.359) 


= 2rt 0 + - 


= JT=> 


I = -Jïr 


Par extension pour -y nous avons: 


l = À~ l =42n (7.360) 


□C.Q.F.D. 

Nous obtenons donc la "loi normale centrée réduite" notée sous forme de fonction de densité de 
probabilité (la notation avec le F majuscule peut malheureusement porter à confusion dans le cadre du 
présennt développement avec le fonction de répartition...): 



(7.361) 


qui peut être calculée dans la version française Microsoft Excel 11.8346 avec la fonction 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


376/4839 



























Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

LOI.NORMALE.STANDARD( ) ou pour la réciproque par LOI.NORMALE.STANDARD.INVERSE( 
)• 

Pour information, une variable suivant une loi Normale centrée réduite est très souvent par tradition 
notée Z (pour "Zentriert" en allemand). 

En revenant aux variables non normées: 

k-np k — [J. 

* = 1 - =- (7.362) 

4npq & 

nous obtenons donc la "fonction Gauss-Laplace" (ou "loi de Gauss-Laplace") ou également appelée 
"loi Normale" donnée sous forme de densité de probabilité par: 


_i*-4 

P(k, fÂ, a) - —== s ^ 

av2jr 


(7.363) 


et souvent notée N( A, cr ). Elle peut être calculée dans la version française de Microsoft Excel 11.8346 
avec la fonction LOI.NORMALE( ) ou pour la réciproque par LOI.NORMALE.INVERSE( ). 

La probabilité cumulée (fonction de répartition) de valoir une certaine valeur k étant bien évidemment 
donnée par: 


H * 

P(X<x) = —= f s" ^ dk 


(7.364) 


Voici un exemple de tracé de la fonction de distribution et répartition pour la fonction Normale de 
paramètres cr) = (0,1): 



ÜL4&- 


0 . 3 -- 


afr- 


Û7- 1 - 


asr- 


Ûl>- 




0. i- - 


Figure: 7.15 - Loi Normale Centrée Réduite (fonction de distribution et de répartition) 


Cette loi régit sous des conditions très générales, et souvent rencontrées, beaucoup de phénomènes 
aléatoires. Elle est par ailleurs symétrique par rapport à la moyenne A (c'est important de s'en 
souvenir). 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


377/4839 





















Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

Montrons maintenant que A représente bien l'espérance mathématique (ou la moyenne) de x (c'est un 
peu bête mais on peut quand même vérifier...): 

-ho h -ho _ 

E{x)= f xf(x)dx =- — f r ' dx (7-365) 

t 0-*J27 TjI 

Posons: 


x — ü 

u =-- (7.366) 

a 


Nous avons dès lors: 


E(X) - f - t= f (ou+fj) 


e 2 crdu 


h -ho 1 « 

1 ~ ~-u 


h -ho 1 -j 

1 --Ü x 

= c — 1= I aue 2 du + G — j= f pie 2 du 

J W2 x i 


cr-viïn 

-ho 1 


Calculons la première intégrale: 


h -ho 1 -î h -ho 1 ■> 


V^r 


J ' J” : lfc '" e 


= 2 


= e 2 


= 0 - 0 = 0 (7.368) 


Donc il vient au final: 


h -ho 1 -a -i 

E(X) = f e~ 2 “ du = (7.369) 

J J 7.71 


yj 2 ?r 


■j 2 Ïr' 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


378/4839 

















Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


Remarques : 

RI. Le lecteur pourrait trouver cela déroutant dans un premier temps que le paramètre d'une 
fonction soit un des résultats que nous cherchons de la fonction. Ce qui dérange est la mise en 
pratique d'une telle chose. Au fait, tout s'éclairera lorsque nous étudierons plus loin dans ce chapitre 
les concepts "d'estimateurs de vraisemblance". 

R2. Indiquons que dans la pratique (finance, qualité, assurance, etc.) il est fréquent de devoir 
calculer l'espérance uniquement pour des valeurs positives de la variable aléatoire qui est définie 
alors naturellement comme étant "l'espérance positive" et donnée par: 

E + (X) = -— f m > dx (7.370) 

try2zr g 

Nous en verrons un exemple pratique dans le chapitre d'Économie lors de notre étude du modèle 
théorique de la spéculation de Louis Bachelier. 


Montrons aussi (...) que ct représente bien l'écart-type de X (il convient, en d'autres termes de montrer 
que V(X) = ct 3 ) et pour cela rappelons que nous avions démontré que (relation de Huyghens): 

V(X) = E(X 2 )-E(X) 2 (7.371) 


Nous avons déjà calculé tout à l'heure E(X) = pi => Eix f = {J} commençons alors par calculer 

Six 2 ): 


i — 1 ( 

E(X 2 )= Çx 2 /(x)dx =—— . f x 2 i* * ) dx (7-372) 

v / J £T*j2jr l 

Posons y = (x - /j) / '■fin qui conduit dès lors à: 

e(x 2 

Or, nous savons: 

-hD -Kil' 

ye~ y dy = 0 J e~ y dy = -Jir (7.374) 

—Tll' 

Il reste donc à calculer la première intégrale. Pour cela, procédons par une intégration par parties (cf. 

[Vincent ISOZ] | http://www.sciences.ch] | Page: 


i -n» ^ rj 4® 

) = -t=. J ( 7 V 2 CT + s~ y dy = —?=&* J y 2 s~ y dy + 2 /zctJ—■ J ye~ y dy 

"V —T£} —Ijj 1 — !£, 

-ko 

je~ y ‘dy 


(7.373) 


379/4839 









Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

chapitre de Calcul Différentiel et Intégral): 


= /COgCOt - 


J y*e~ y 'dy = J.y = "7^ 



(7.375) 


D'où: 


Æfjf 2 ) = -^Lcr 2 + 2 /ict f^-0 + -^LyJïr = ft 2 + o 2 


(7.376) 


Il vient finalement: 


^(JQ = £(Jf 2 ) - £(jf) 2 = a 2 (7.377) 

Une signification supplémentaire de l'écart-type dans la loi de Gauss-Laplace est une mesure de la 
largeur de la distribution telle que (cela ne peut se vérifier qu'à l'aide d'intégration à l'aide de méthodes 
numériques) que toute moyenne et pour tout écart-type non nul nous avons: 



La largeur de l'intervalle a une très grande importance dans l'interprétation des incertitudes d'une 
mesure. La présentation d'un résultat comme N ±cr signifie que la valeur moyenne a environ 68.3% de 
chance (probabilité) de se trouver entre les limites de fj - & et ou qu'elle a environ 95.4% de 

se trouver entre - 2cr et N + 2cr etc. 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


380/4839 























Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


Remarque:Ce concept est beaucoup utilisé en gestion de la qualité en entreprise particulièrement 
avec le concept industriel anglo-saxon Six Sigma (cf. chapitre de Génie Industriel) qui impose une 
maîtrise de 6 cr autour de chaque côté (!) de la moyenne des côtés des pièces fabriquées (ou tout 
autre sujet dont on mesure la déviation). 


Niveau de qualité 
Sigma 

Taux de non-défection 

assuré en % 

Taux de défection 
en parties par 
million 

1 a 

68.26894 

317311 

2 a 

95.4499 

45'500 

3a 

99.73002 

2700 

4 a 

99.99366 

63.4 

5 a 

99.999943 

0.57 

6 a 

99.9999998 

0.002 


Tableau: 7.7 - Niveau de qualité Sigma avec taux de défection/non-défection 


La deuxième colonne du tableau peut facilement être obtenue avec Maple 4.00b. Par exemple pour 
la première ligne: 

>S:=evalf(int(l/sqrt(2*Pi)*exp(-x A 2/2),x=-l..l)); 
et la première ligne de la troisième colonne par: 

>(1-S)*1E6; 

Si la loi Normale était décentrée, il suffirait alors d'écrire pour la deuxième colonne: 
>S:=evalf(int(l/sqrt(2*Pi)*exp(-(x-mu) A 2/2),x=-l.. 1)); 

et ainsi de suite pour tout écart-type et toute moyenne on retombera sur les mêmes intervalles! ! ! 


La loi de Gauss-Laplace n'est par ailleurs pas qu'un outil d'analyse de données mais également de 
génération de données. Effectivement, cette loi est une des plus importantes dans le monde des 
multinationales qui recourent aux outils statistiques pour la gestion du risque, la gestion de projets et la 
simulation lorsqu'un grand nombre de variables aléatoires sont enjeu. Le meilleur exemple 
d'application en étant le logiciel CrystalBall ou @Risk de Palisade (mon préféré...). 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


381/4839 
























Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

Dans ce cadre d'application (gestion de projets), il est par ailleurs très souvent fait usage de la somme 
(durée des tâches) ou le produit de variables aléatoires (facteur d'incertitude du client) suivant des lois 
de Gauss-Laplace. Voyons comment cela se calcule: 

5.9.1. SOMME DE DEUX VARIABLES ALÉATOIRES NORMALES 

Soient X, Y deux variables aléatoires indépendantes. Supposons que X suit la loi N ) et que Y suit 

la loi N{fJ 2 , ct 2 ) . Alors, la variable aléatoire Z - X+Y aura une densité égale au produit de 
convolution d ef x et f Y . C'est-à-dire: 


fz (s) = J fx (*) fï ( S - *) dx = T - \ s 2CFl s 2<X2 d * 

ce qui équivaut à faire le produit conjoint (cf. chapitre de Probabilités) des probabilités d'apparition des 
deux variables continues (se rappeler le même genre de calcul sous forme discrète!) 

Pour simplifier l'expression, faisons le changement de variable t = x- et posons a = + u 2 - s, 

C— • 

Comme: 


[s-x-fY^j = -[-s + x + {X^j =[-s + x + }2^j ={t + aŸ (7.379) 


nous obtenons: 


fz ( s ) - J 


f 2 (f-HJ) 


at-\ 


l3lT-| 




s “■ e ‘ dt = --- e 

2zro[a 2 2zra[cr 2 

2 




dt 


(7.380) 


1 2 —co 


e 2a2 J e 


U 


dt 


Nous posons: 


et +■ 


tcf 


U = 


du e 


'■f2e l a 2 dt ^2^ a 2 


=>dt= ■72ct 1 e 2 — 


du (7.381) 

a 


Alors: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


382/4839 

























[SCIENCES.CH] 



(7.382) 


Sachant que: 


J s~^du = Jÿr (7.383) 


et: 


a 2 = (-ff + ^+^) 2 = [-( s -^-^ 2 )] 2 = ( s - / u l - v 2 ) 2 ( 7 - 


notre expression devient: 



Nous reconnaissons l'expression de la loi de Gauss-Laplace de moyenne j.\ + j.u et d'écart type 



Par conséquent, X+Y suit la loi: 



Le fait que la somme de deux lois Normales donne toujours une loi Normale est ce que nous nommons 
en statistiques la "stabilité par la somme" de la loi de Gauss-Laplace. Nous retrouverons ce type de 
propriétés pour d'autres lois que nous étudierons plus loin. 


Remarque : Les familles de lois stables par addition constituent un domaine important d'étude en 
physique, finance et statistiques appelé "distribution de Lévy alpha-stables". Si le temps me le 
permet, je présenterai les détails de ce domaine d'étude extrêmement important dans le présent 
chapitre. 


5.9.2. PRODUIT DE DEUX VARIABLES ALÉATOIRES NORMALES 

Soient X, Y deux variables aléatoires indépendantes réelles. Nous désignerons par f x et f Y les densités 
correspondantes et nous cherchons à déterminer la densité de la variable Z - X Y ■ 

Notons/la fonction de densité du couple (A, T). Vu que X, Y sont indépendantes (cf. chapitre de 
Probabilités): 


f(z,ÿ) =//» • /y O) G- 387 ) 


La fonction de répartition de Z est: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


383/4839 




















Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

F{z) = P{Z <z) = P{X Y <z) = \\ f ( x, y)dxdy = JJ f x {x) ■ f Y (y)dxdy (7 388) 

D D 


où D= | x y <z] . 

D peut se réécrire comme union disjointe (nous faisons cette opération pour anticiper lors du futur 
changement de variables une division par zéro): 

fl = Z) 1 Ufl 2 U^ (7.389) 


avec: 

D\ = e | x- y <z et x > ûj 

A={(*. y) e IR 2 | z -y <z et x < O} (7.390) 

A = {(*,.y) e IR 2 | xy <z et* = 0] 

Nous avons: 

F ( z ) = JJ /jW • fv (y) dxd y+ JJ /iW • Jy C y) dxd y+ JJ /jW ■ fy (y) dxd y 

n A A (7-391) 

_ _.« 

=0 

La dernière intégrale vaut zéro car ZJ, est de mesure (épaisseur) nulle pour l'intégrale selon x. 


Nous effectuons ensuite le changement de variable suivant: 


x - x 


U = xy 


(7.392) 


Le jacobien de la transformation est: 


1 0 
—t / x 2 1 ! x 


w 


(7.393) 


Donc: 


*(,) - } | 

—CO 0 | J?L | -00-00 | J?L | 

= j 

-oo -oo \^\ 

Notons f z la densité de la variable Z. Par définition: 


(7.394) 


F{z)=\fM)dt (7.395) 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


384/4839 














Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

D'un autre côté: 


Z -K» 


F< ~’> = 11 




drdt 


(7.396) 


comme nous venons de le voir. Par conséquent: 



(7.397) 


Ce qui est un peu triste c'est que dans le cas d'une loi de Gauss-Laplace (loi Normale), cette intégrale 
ne peut être calculée simplement que numériquement... il faut alors faire appel à des méthodes 
d'intégration du type Monte-Carlo (cf. chapitre de Méthodes Numériques). 

D'après quelques recherches faites sur Internet cependant, mais sans certitude, cette intégrale pourrait 
être calculée et donnerait une nouvelle loi appelée "loi de Bessel". 

5.9.3. LOI NORMALE CENTRÉE RÉDUITE 


La fonction de Gauss-Laplace n'est pas tabulée puisqu'il faudrait autant de tables numériques que de 
valeurs possibles pour la moyenne P et l'écart-type cr (qui sont donc des paramètres de la fonction 
comme nous l'avons vu). 

C'est pourquoi, en opérant un changement de variable, la loi Normale devient la "loi Normale centrée 
réduite" où: 

1. "Centrée" signifie soustraire la moyenne A (la fonction à alors pour axe de symétrie l'axe des 
ordonnées). 

2. "Réduite" signifie, diviser par l'écart-type cr. 

Par ce changement de variable, la variable k est remplacée par la variable aléatoire centrée réduite: 

k* = ÏLJi (7.398) 

CT 


Si la variable k a pour moyenne A et pour écart- type cr alors la variable k * = 
0 et pour écart-type 1. 


k~ pi 
cr 


a pour moyenne 


Donc la relation: 


i 

P(k,{Â, CT") =- J= e ^ 

ctv2jt 


s'écrit alors (trivialement) plus simplement: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


385/4839 















Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


P(k* 0,1) 



(7.400) 


qui n'est d'autre que l'expression de la loi Normale centrée réduite souvent notée ./V(0,1) que nous 
retrouverons très fréquemment dans les chapitres relatifs à la physique, la finance, la gestion et 
l'ingénierie! 


Remarque : Calculer l'intégrale de la relation précédente entre n'importe quelles bornes n'est pas 
possible formellement parlant de manière exacte. Une idée possible et simple consiste alors à 
exprimer l'exponentielle en série de Taylor et de faire ensuite l'intégration terme par terme de la 
série (en s'assurant de prendre suffisamment de termes pour la convergence!). 


5.9.4. DROITE DE HENRY 

Souvent, dans les entreprises c'est la loi de Gauss-Laplace (Normale) qui est analysée mais des logiciels 
courants et facilement accessibles comme Microsoft Excel sont incapables de vérifier que les données 
mesurées suivent une loi Normale lorsque nous faisons de l'analyse fréquentielle (aucun outil intégré 
par défaut ne permet de le faire) et que nous n'avons pas les données d'origines non groupées. 

L'astuce consiste alors à utiliser la variable centrée réduite qui se construit comme nous l'avons 
démontré plus haut avec la relation suivante: 

k* = '—^ (7.401) 

CT 

L'idée de la droite d'Henry est alors d'utiliser la relation linéaire entre k et k* donnée par l'équation de la 
droite: 


k* = f(k) = —- — (7.402) 

CT CT 

et qui peut être tracée pour déterminer la moyenne et l'écart-type de la loi Normale. 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


386/4839 












Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

Exemple: 

Supposons que nous ayons l'analyse fréquentielle suivante de ÎO'OOO tickets de caisse dans un 
supermarché: 


Montant des 

tickets 

Nombre de tickets 

Nombre cumulé de 

tickets 

Fréquences 
relatives cumulées 

[0,50[ 

668 

668 

0.068 

[50,100[ 

919 

l'587 

0.1587 

[ 100,150[ 

l'498 

3'085 

0.3085 

[150,200[ 

l'915 

5'000 

0.5000 

[200,250[ 

l'915 

6'915 

0.6915 

[250,300[ 

l'498 

8'413 

0.8413 

[300,350[ 

919 

9'332 

0.9332 

[350,400[ 

440 

9772 

0.9772 

[400 et + 

228 

ÎO'OOO 

1 


Tableau: 7.8 - Intervalles de classe pour la détermination de la droite de Henry 


Si nous traçons maintenant cela sous Microsoft Excel 11.8346 nous obtenons: 



Figure: 7.17 - Distribution des ventes de tickets 


Ce qui ressemble terriblement à une loi Normale d'où l'autorisation, sans trop de risques, d'utiliser dans 
cet exemple la technique de la droite d'Henry. 

Mais que faire maintenant? Eh bien connaissant les fréquences cumulées, il ne nous reste plus qu'à 
calculer pour chacune d'entre elles k* à l'aide de tables numériques ou avec la fonction NORMSINV( ) 
de la version anglaise de Microsoft Excel 11.8346 (car rappelons que l'intégration formelle de la 
fonction gaussienne n'est pas des plus faciles...). 

Ceci nous donnera les valeurs de la loi Normale centrée réduite iV(0,l) de ces mêmes fréquences 
respectives cumulées (fonction de répartition). Ainsi nous obtenons (nous laissons le soin au lecteur de 
chercher sa table numérique ou d'ouvrir son logiciel préféré...): 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


387/4839 


























Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


Borne supérieure de 
l'intervalle 

Fréquences relatives 
cumulées 

Correspondance pour 
k* de iV(0,l) 

50 

0.068 

-1.5 

100 

0.1587 

-1 

150 

0.3085 

-0.5 

200 

0.5000 

0 

250 

0.6915 

0.5 

300 

0.8413 

1 

350 

0.9332 

1.5 

400 

0.9772 

2 

- 

1 

- 


Tableau: 7.9 - Fréquences relatives cumulées pour la droite de Henry 


Signalons que dans le type de tableau ci-dessus, dans Microsoft Excel, les valeurs de fréquences 
cumulées nulles et unitaires (extrêmes) posent problèmes. Il faut alors jouer un petit peu... 

Comme nous l'avons spécifié plus haut, nous avons sous forme discrète: 

^ ( 7 - 403 > 

C C 

Donc graphiquement sous Microsoft Excel 11.8346 nous obtenons grâce à notre tableau le graphique 
suivant (évidemment en toute rigueur on fera une régression dans les règles de l'art comme vu dans le 
chapitr de Méthodes Numériques avec intervalles de confiance, de prédiction et tout le toutim...): 



Figure: 7.18 - Forme linéarisée de la distribution 


Donc à l'aide de la régression donnée par Microsoft Excel 11.8346 (ou calculée par vos soins selon les 
techniques de régressions linéaires vues dans le chapitre de Méthodes Numériques). Il vient: 

k* = — --= 0.01*-2 (7.404) 

c a 


dont nous déduisons immédiatement: 


cr= 100 /t= 200 (7.405) 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


388/4839 




























Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

Il s'agit donc d'une technique particulière pour une distribution particulière! Des techniques similaires 
plus ou moins simples (ou compliquées suivant les cas) existent pour nombre de distributions. 

Voyons une autre manière approximative d'aborder le problème. Reprenons pour cet exemple notre 
tableau: 


Tickets 

Borne droite 

Centre 

Fréquences 

relatives cumulées en% 

[0,50[ 

50 

25 

6.8 

[50,100[ 

100 

75 

15.87 

[100,150[ 

150 

125 

30.85 

[150,200[ 

200 

175 

50.00 

[200,250[ 

250 

225 

69.15 

[250,300[ 

300 

275 

84.13 

[300,350[ 

350 

325 

93.32 

[350,400[ 

400 

375 

97.72 

[400 et + 

- 

- 

100 


La moyenne sera maintenant calculée à l'aide de la valeur centrale des intervalles et des effectifs selon 
la relation vue au début de ce chapitre: 


N 

Z 

■■■■■ J =1 

^ = T- 

z* 

1=1 


(7.406) 


Tickets 

Centre 

iTickets 

(fréquence) 

Calcul 

[0,50[ 

25 

668 

16700 

[50,100[ 

75 

919 

68'925 

[ 100,150[ 

125 

1 '498 

187'250 

[150,200[ 

175 

l'915 

335T25 

[200,250[ 

225 

l'915 

430'875 

[250,300[ 

275 

l'498 

411*950 

[300,350[ 

325 

919 

298'675 

[350,400[ 

375 

440 

165'000 

[400 et + 

- 

- 

- 


Somme: 

9772 

l'914'500 



Moyenne: 

l'914'500/9'772 

=195.92 


La moyenne expérimentale est donc assez proche de la moyenne théorique obtenue précédemment 
avec la droite de Henry. 

L'écart-type sera maintenant calculé à l'aide de la valeur centrale des intervalles et des effectifs selon la 
relation vue aussi au début de ce chapitre: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


389/4839 














































Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


cr = 


N 2 

Z**(* “ x ) 

1=1 


N 

Z*=- 

!=1 


(7.407) 


Tickets 

Centre 

Tickets 

(fréquence) 

Calcul 

[0,50[ 

25 

668 

1997.00 

[50,100[ 

75 

919 

1375.08 

[100,150[ 

125 

1*498 

771.02 

[150,200[ 

175 

1*915 

85.76 

[200,250[ 

225 

1*915 

165.71 

[250,300[ 

275 

1*498 

958.65 

[300,350[ 

325 

919 

1566.93 

[350,400[ 

375 

440 

1443.98 

[400 et + 

- 

228 

- 



Variance: 

8364.16 



Ecart-Type: 

91.45 


L'écart-type expérimental est donc assez proche de l'écart-type théorique obtenu avec la méthode de la 
droite de Henry. 

5.9.5. DIAGRAMME QUANTILE-QUANTILE 

Une autre manière de juger qualitativement de l'ajustement de données expérimentales avec une loi 
théorique (quelle qu'elle soit!!!) est l'utilisation d'un "diagramme quantile-quantile". 

L'idée est assez simple, il s'agit de comparer les données expérimentales, aux données théoriques 
supposées suivre une loi donnée. Ainsi, dans le cas de notre exemple nous avons en prenant les valeurs 
de la moyenne théorique (~200) et l'écart-type théorique (~100) obtenus avec la droite de Henry: 


Tickets 

Borne de droite 

expérimentale 

(imposée) 

Fréquences 
relatives cumulées 

Borne de droite 
théorique (calculée) 

[0,50[ 

50 

6.80% 

50.91 

[50,100[ 

100 

15.87% 

100.02 

[ 100,150[ 

150 

30.85% 

149.99 

[150,200[ 

200 

50.00% 

200 

[200,250[ 

250 

69.15% 

250.01 

[250,300[ 

300 

84.13% 

299.98 

[300,350[ 

350 

93.32% 

350.00 

[350,400[ 

400 

97.72% 

399.90 

[400 et + 

- 

100% 

- 


Représenté graphiquement, cela nous donne donc le fameux diagramme quantile-quantile: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


390/4839 





































Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 



Et bien évidemment on peut comparer les quantiles observés à toute loi théorique supposée. Plus les 
points seront alignés sur la droite, meilleur sera l'ajustement! C'est très visuel, très simple et beaucoup 
utilisé par les non spécialistes en statistiques dans les entreprises. 

5.10. FONCTION LOG-NORMALE 

Nous disons qu'une variable aléatoire positive X suit une "fonction log-normale" (ou "loi log-normale") 
de paramètres /t,cr > 0 (moments de la loi log-Normale), si et seulement si en posant: 

y = ln(J0 (7.408) 


nous voyons que y suit une fonction de probabilité de type loi Normale de moyenne A et de variance 
cr 3 (moments de la loi Normale). 

In exteno, de par les propriétés des logarithmes, une variable peut être modélisée par une loi 
log-normale si elle est le résultat de la multiplication d'un grand nombre de petits facteurs indépendants. 

La fonction de densité de X pour x > 0 est alors (cf. chapitre de Calcul Intégral): 


■+ { T T + -. 

f (ln(x)-,a) 2 l 

J W — r -— ËXp 

2^ J 


(7.409) 


qui peut être calculée dans la version française de Micrsoft Excel 11.8346 avec la fonction 
LOI.LOGNORMALE( ) ou pour la réciproque par LOI.LOGNORNALE.INVERSE( ). 

Ce type de scénario se retrouve fréquemment en physique, dans les techniques de maintenance ou 
encore en finance des marchés dans le modèle de pricing des options (voir ces chapitres respectifs du 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


391/4839 


















Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

site pour des exemples concrets). Il y a par ailleurs une remarque importante relativement à la loi 
log-normale dans le traitement plus loin du théorème central limite! 


Montrons que la fonction de probabilité cumulée correspond bien à une loi Normale si nous faisons le 
changement de variable mentionné précédemment: 


+:o -+00 | 

f f{x)dx = [-ÿ=exp 

o o oW 2 jt 


(ln (*)-/j) 2 ^ 
2a 2 


dx = 




-Ko 1 

: 1 c 


exp 


(In(x)-A ) 
2a 2 


2 '\ 


dx (7.410) 


en posant: 


y = ln(x) =$- = -=> dx = xdy 
dx x 


(7.411) 


et: 


x=e y (7.412) 


nous avons bien: 


-Ko 1 -Ko 1 

f f(x)dx - —== f -exp 
J 0 aV2zr J x 


(ln 00-/4)^ 
2a 2 


dx 


1 f 1 ( 


(7-Mj 

2 cr 2 


xdy 


h -ko Ct-m) 

1 f -i _2 


(7.413) 


\f2n 


CT' 


| e 


dy 


nous tombons donc bien sur une loi Normale! 

L'espérance (moyenne) de X est donnée alors par (le logarithme népérien n'étant pas défini pour x < 0 
nous bornons l'intégrale à partir de zéro): 


B(X)= ^xf(x)dx = —j= | 


exp 


' ln(x) - j ' 
2 O 2 


r-VTr 1. 


exp 


u ~ f ' 


2 a 2 


2 ’l 
+ U 


dx 


du 


où nous avons effectué le changement de variable: 

u = ln(x) x = e u , xdu = dx (7.415) 

L'expression: 


' u ~ {À i 
2a 2 


+ u (7.416) 


étant par ailleurs égale à: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


392/4839 































Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


1 ' . 2 2 

-- T l I U -I U + 0 2 I I ~\U + 0 2 \ + U 2 I (7.417) 

2 O 2 


la dernière intégrale devient donc: 


exp 


E(X) = 


£i + O 2 I - ff 

2? 


CT‘ 


■JTjÏ 


exp 


_a 2 2 ' 

i fA + cr i - /r 

2c? 


exp 


J ex p 


oM 

m+ Y 


^ \U pi+ U 2 II | üfo 


2a 2 


(7.418) 


et où nous avons utilisé la propriété qui a émergée lors de notre étude de la loi Normale, c'est-à-dire que 
toute intégrale de la forme: 


-Ko 


I X-C te I 


j e ~ 2cr! dx - cr-J2Ïr 


a donc toujours la même valeur! 

Pour le caclul de la variance, rappelons que pour une variable aléatoire X celle-ci est définie par: 

V{X) = E (X 2 ) - E {X) 2 (7.420) 

Calculons E ■ X 2 ■ en procédant de manière similaire aux développements précédents: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


393/4839 



















Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


-Ko 1 -Ko 

E\X 2 \= j x 2 f(x)dx = —j xexp 


ilnW-^ 2 ^ 


0 

-Ko 






ct 


K 


exp 


CT 


/ , ■ 2 ^ 

iu-v) 


2 CT 2 


2a 2 


-Ko 


g u du = 


CT' 




exp 


dx 


fi -2 

(«“A) 


2CT 2 


+ 2u 


liü 


1 


-Ko / 


1 


v 2 


i / w + 2o 2 JJ - (/7 + 2CT 2 ] 2 + pi 


—7= ! ex P ' 

/ 

-K» 


=—i 

oÆr ‘ 


exp 


2CT 2 ^ 
!«-(// + 




2 \\ 2 f ’ 
2CT 2 I 


2CT 2 


exp 


|> + 2o 2 ) 2 
2CT 2 


du 


(7.421) 


f JA+2o 2 \-f?""' 
eXP 2^ 


t^2tt 




= exp 


2 2 \ 


i> + 2o 2 i 
2a 2 


-K» 

J exp 


= exp 


f , : , s, 2 >1 

ïu-i/4 + 2CT 2 'l| 


2CJ 2 


4/7CT 2 + 4ct 4 ^ 

2 CT 2 




= expf2^ + 2a 2 )= e 2 ^ +aa ) 


où nous avons encore une fois le changement de variable: 

u = ln(x) <4> x = e u , xdu = dx (7.422) 
et où nous avons transformé l'expression: 


sous la forme: 


' u - jÀ ' 
^ r " 


+ 2u (7.423) 


2CJ 2 


I pi + 2 CT 3 II - i pi + 2o 2 i + pi 2 I (7.424) 


Donc: 


FXST) = E(X 2 ) -E(X) 2 = exp [2pi-+ 2a 2 ) 

= exp {2pi + 2 ct 2 J - exp (2^ + CT 2 ) = ^ +a3 (^-l 


/ _2 NV* 


CT 2 

^ + T,, 

yy 


Voici un exemple de tracé de la fonction de distribution et répartition pour la fonction Log-Normale de 
paramètres (pi, ct) = (0,1): 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


394/4839 

















































Figure: 7.20 - Loi Log-Normale (fonction de distribution et de répartition) 


5.11. FONCTION UNIFORME CONTINUE 


Soient a < b ■ Nous définissons la fonction de distribution de la "fonction uniforme" (ou "loi uniforme") 
par la relation: 


^(*) = 


1 

b - a 


Wl 


(7.426) 


Nous avons donc pour fonction de répartition: 


P{X -^ = Jrbwi* = rrr Wif * = 


b -a 


b - a 


Il s'agit bien d'une fonction de distribution car elle vérifie (intégrale simple): 

-Ko -Ko i i b 

W] j _ Wl 

b-a b-a 




b-a 

Ml~ - = 1 ( 7 - 427 > 


b-a 


La fonction uniforme a par ailleurs pour espérance (moyenne): 


= E{X) - [ xf (x)dx - —-— [ xdx - —- 
^ A — ^ A — 


1 ^ 


b-a' 

1 (b +à)(b - à) a + b 


b-a 2 


1 /> 2 -a 2 

b - a 2 


(7.428) 


b-a 2 2 

et pour variance en utilisant la relation de Huyghens: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


395/4839 































Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


F(X) = E{X 2 ) - E(X) 2 = J x 2 f(x)dx- J x 2 dx 


a + b 


1 


b - a 3 


a + b 


1 à 3 -a 3 


a + b 


b-a 


1 {b-a){¥ +ab+a*) 


2 ■ -*• ■ ~ 2v ''a+iŸ 


(7.429) 


b-a 3 

1 ,,2 , 2\ 1 ,,2 r, i 2\ 4(è 2 + aè + df 2 ) — 3(è 2 + 2ab H-a 2 ) 

= -(^ + 3*+^)--^ +2ab+a A ) = -i------ 

3 4 12 

Ab 2 +4ab+4a 2 -3b 2 -6ab-3a 2 b 2 -2ab-a 2 (b-a) 2 


12 


12 


12 


lj^j signifie qu'en dehors du domaine de définition [a,b] la fonction de distribution est nulle. Nous 
retrouverons ce type de notation dans certaines autres fonctions de distribution. 

Voici un exemple de tracé de la fonction de distribution et respectivement de répartition pour la loi 
Uniforme continue de paramètres (a, b) - (0,1) : 



Figure: 7.21 - Loi uniforme continue (fonction de distribution et de répartition) 


Remarque : Cette fonction est souvent utilisée en simulation dans les entreprises pour signaler que la 
variable aléatoire a des probabilités égales d'avoir une valeur comprise dans un certain intervalle 
(typiquement dans les rendements de portefeuilles ou encore dans l'estimation des durées des 
projets). Le meilleur exemple d'application étant à nouveau le logiciel CrystalBall ou @Risk qui 
s'intégrent dans MS Project. 


Voyons un résultat intéressant de la loi Uniforme continue (et qui s'applique à la discrète aussi en fait...). 

Souvent j'entends des gestionnaires (qui se jugent de haut niveau) dire que comme une mesure a une 
probabilité égale d'avoir lieu dans un intervalle fermé donné, alors la somme de deux variables 
aléatoires indépendantes du même type aussi! 

Or nous allons démontrer ici que ce n'est pas le cas (si quelqu'un a une démonstration plus élégante je 

[Vincent ISOZ] | http://www.sciences.ch] | Page: 


396/4839 





























Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

suis preneur)! 

Démonstration: 


Considérons deux variables aléatoires indépendantes X et Y qui suivent une loi uniforme dans un 
intervalle fermé [0,a], Nous cherchons donc la densité de leur somme qui sera notée: 


Nous avons alors: 


Z=X + Y (7.430) 


/iW = /fW = 


si 0 < x, y < a 
sinon 


(7.431) 


avec la variable: 


0 < z < 2a (7.432) 

Pour calculer la loi de la somme, rappelons que nous savons qu'en termes discrets cela équivaut à faire 
le produit conjoint des probabilités (cf. chapitre de Probabilités) d'apparition des deux variables 
continues (se rappeler le même genre de calcul sous forme discrète!) 


C'est-à-dire: 


+Œ> 

Sz O) = J Sx ( z - y)fv ( x) d y (1 - 

-no 


Comme f Y (y) = 1 si 0 <y < a et 0 sinon alors le produit de convolution précédent se réduit à: 


fz( z ) = Ifxte-ÿtây ( 7 - 
0 

L'intégrant vaut par définition 0 sauf lorsque par construction 0 <z-y <a où il vaut alors 1. 

Intéressons-nous alors aux bornes de l'intégrale dans ce dernier cas qui est bien évidemment le seul qui 
est intéressant.... 

Faisons d'abord un changement de variables en posant: 

u=z-y (7.435) 

d'où: 

du = -dy (7.436) 

L'intégrale s'écrit alors dans cet intervalle après ce changement de variable: 

a z-o. z 

h ( z ) = J fx ( z - y) d y =- f Ix ( y) du = j du c- 

0 Z Z~i2 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


397/4839 






Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

En se rappelant comme vu au début que 0 <z <2a, alors nous avons immédiatement si z < 0 et 
z > 2a que l'intégrale est nulle. 

Nous allons considérer deux cas pour cet intervalle car la convolution de ces deux fonctions 
rectangulaires peut se distinguer selon la situation où dans un premier temps elles se croisent 
(s'emboîtent), c'est-à-dire où 0 < z < a , et ensuite s'éloignent l'une de l'autre, c'est-à-dire a <z < 2a ■ 

- Dans le premier cas (emboîtement) où 0 <z < a '■ 


Z Z 

fz(u)= J du - J du - = z (7.438) 

Z~i2 0 

où nous avons changé la borne inférieure à 0 car de toute façon f x {ü) est nulle pour toute valeur 
négative (et lorsque 0 <z <a , z,- a est justement négatif ou nul!). 

- Dans le deuxième cas (déboîtement) où a <z < 2a ■ 

z a 

f z (u) = | du = | du = u = a - (z - a) = 2a - z (7.439) 

z—a z—a 

où nous avons changé la borne supérieure à a car de toute façon f x (u) est nulle pour toute valeur 
supérieure (et lorsque a <z < 2a ,z est justement plus grand que a). 

Donc au final, nous avons: 


z 

fz( z ) = i 2a-z 
0 


si 0 < z < a 
si a < z < 2a 
sinon 


(7.440) 


□C.Q.F.D. 

Il s'agit d'un cas particulier, volontairement simplifié, de la loi triangulaire que nous allons voir de suite. 

Ce résultat (qui peut sembler contre intuitif) se vérifie en quelques secondes avec un tableur comme 
Microsoft Excel 11.8346 en utilisant la fonction ALEA.ENTRE.BORNES( ) et la fonction 
FREQUENCE( ) dans la version française. 

5.12. FONCTION TRIANGULAIRE 


Soient a <c <b- Nous définissons la "fonction triangulaire" (ou "loi triangulaire") par construction 
basée sur les deux fonctions de distribution suivantes: 


P a ,c « = 


2{x - a) 

{b - d)(c - a) 
2(&-jQ 
(b - a)(b - c ) 


Wl 
b fil 


(7.441) 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


398/4839 











Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


où a est souvent assimilée à la valeur optimiste, c la valeur attendue (le mode) et b la valeur pessimiste. 

C'est effectivement la seule manière de l'écrire si le lecteur garde à l'esprit que le triangle de base c-a 
doit avoir une hauteur h valant 2/(c-a) telle que sa surface totale soit égale à l'unité (nous allons de suite 
le montrer). 

Voici un exemple de tracé de la fonction de distribution et répartition pour la fonction triangulaire de 
paramètres (a,c,ù)=(0,3,5): 



Ü? 

Figure: 7.22 - Loi triangulaire (fonction de distribution et de répartition) 


La pente de la première droite (croissante de gauche) est donc bien évidemment: 

2 


(ù - a) (c - a) 


(7.442) 


et la pente de la deuxième droite (décroissante à droite): 


-2 


(.b - a)(b — c) 


(7.443) 


Cette fonction est une fonction de distribution si elle vérifie: 


-Ko 

p= \(P aie (x) + P eJb (x))dx = 1 (7. 


Il s'agit dans ce cas de faire du triangle qui rappelons-le est simplement la base multipliée par la hauteur 
le tout divisé par 2 (cf. chapitre sur les Formes Géométriques): 


1 


(b-a)' 


(b-a). 


= 1 (7.445) 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


399/4839 

















Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


Remarque : Cette fonction est beaucoup utilisée en gestion de projet dans le cadre de l'estimation 
des durées des tâches ou encore en simulations industrielles. La valeur a correspondant à la valeur 
optimiste, la valeur c à la valeur attendue (mode) et la valeur b à la valeur pessimiste. Le meilleur 
exemple d'application étant à nouveau le logiciel CrystalBall ou @Risk qui s'intégrent dans MS 
Project. 


La fonction triangulaire a par ailleurs une espérance (moyenne): 

b 


-H» 


j-i - f xf{x)dx - [ x ———— dx+\x —— 

L { (b-a)(c-à) [ (i h-a){b-c ) 


2 (b-x) 


dx 


(b - a) (c - à) y 3 


■ilj-y 


+ - 


fi 


+ - 


( b - à) (c - à) 

_ 2 _ 

(.b — a)(b - c) 


(f\ 


1 3 1 2] 

3 2 J 


(b-a)(b-c) 1,2 

fl 3 1 3 XX 

— a - —a 

2 , 




/ 


3 1,3^ ( 1.2 1 


— b J I - I — bc 2 — c 3 


v 


(è-0 


= 2 - 


f \ 3 1 


2 ) \2 
3 \ 


a 


-c -—ac + — 

v3 2 J 6 


f 


+ (c-a) 


1,3 (\. ï 1 


J 


V 


- b J - 
6 


* , 2 * 1 * 3 

—bc -—c 


JJ 


= 2 


{b -a)(c - d)(b - c) 

1,3 1 y? ba 3 1 X 1 3 a c 

-ber --j&c  + - -Xr + -ac J - - 

3 SI 6 A 2 6 


+2 


(& - a)(c - a)(b - c ) 

1 3 1,3 1 X oX 1 jXl 1 3 

—cX - — bc* + Xr ~ - +—Æbc A -—ac J 

6 2 >3 6 yT 3 


f, 


(b -a)(c - a)(b- c) 

3 1 3 1 3 bc? ai? 


— bc + ac - - a c + - cb + - 


bc - — ac 
3 3 


(b ~a)(c - a)(b - c) 

1,3 13.1,3 1,3.1,3.1 3 

— — bc --a c + -ba --ab +—cb + — ac 
,3 3 3 3 3 3 


(b -a)(c - a)(b - c) 

I Ç-èc 3 - a 3 c + ba 3 - ab 3 +cb 3 + ac 3 J 
3 (b-a)(c - a) (b - c) 

1 (a + b + c)(b - a)(c - a)(b - c) 

3 (b-d)(c - d)(b - c) 

a + b + c 


(7.446) 


et pour variance: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


400/4839 
















































Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


-HD 


O 2 = J (x~M) 2 f(x)dx=\(x~v) 


2 2Q - a ) 

(b - a)(c - a) 


dx + J (x- jJ) 


2 2Q>-x) 

{b - à){b -c) 


-dx 


] c ^-3c 3 + 8 c 2 / a + 4c 2 ü - 6 c/t 2 -12 cfja + \2pi 2 a J ] a 2 ^a 2 - A fia + &/J 2 J 
6 (b-a)(c-a) 6 (b-a)(c-a) ( 7 . 447 ) 

! (-3c 3 + 8 c 2 /t + 4c 2 £-6c/t 2 -Uc^b + U^b) 1 b 2 {b 2 -4/Æ + 6 // 2 ) 


6 


(è - a)(c - a) 




6 (à - o)(c - a) 


1,2 1 , 2 , 1 , 1 2 2 2 1 2 1 2 

-—b + — ba- — ub + —bc+ — a - — üa + U + — cct-—cU+—c 
6 6 3 6 6 3 6 3 6 

on remplace A par l'expression obtenue précédemment et on simplifie (c'est de l'algèbre élémentaire 
pénible...): 




a 2 + b 2 +c 2 -ab-ac -bc 
18 


(7.448) 


Nous pouvons montrer que la somme de deux variables aléatoires indépendantes chacune de loi 
uniforme sur [a,b] (donc indépendantes et identiquement distribuées) suit une loi triangulaire sur 
[2a,2b] mais si elles n'ont pas les mêmes bornes, alors leur somme donne un truc qui n'a pas de nom à 
ma connaissance... 


5.13. FONCTION DE PARETO 


La "fonction de Pareto" (ou "loi de Pareto"), appelée aussi "loi de puissance" ou encore "loi scalante" 
est la formalisation du principe des 80-20. Cet outil d'aide à la décision détermine les facteurs (environ 
20 %) cruciaux qui influencent la plus grande partie (80%) de l'objectif. 


Remarque : Cette loi est un outil fondamental et basique en gestion de la qualité (cf. chapitre de 
Génie Industriel et Techniques de Gestion). Elle est aussi utilisée en réassurance. La théorie des 
files d'attente s'est intéressée à cette distribution, lorsque des recherches des années 1990 ont 
montré que cette loi régissait aussi nombre de grandeurs observées dans le trafic Internet (et plus 
généralement sur tous les réseaux de données à grande vitesse). 


Une variable aléatoire est dite par définition suivre une loi de Pareto si sa fonction de répartition est 
donnée par: 


P{X< *) = 1 — 


A m 


X J 


(7.449) 


avec x qui doit être supérieur ou égal à jc . 

La fonction de densité (fonction de distribution) de Pareto est alors: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


401/4839 



















Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

Jfc ^ __k 

'C ^ X ~ X m \ kx 

(7.450) 


avec k e M + et x > x m > 0 (donc x > 0 )• 

La distribution de Pareto est donc définie par deux paramètres, % m et k (nommé "index de Pareto"). 
Cette une loi dite aussi à "invariance d'échelle" ou "loi fractale", terme définissant la propriété suivante: 


/(x) = T 

dx 


1 - 


/ 


\ * J 

k 


= kx k X~ k ~ l =k^r 
™ £+1 


d 

dx 


\ k 


\ x J 


= - A' 


d_ 1 
dx . 


A 


te 


x I 


= h ^ I 


te 


-k -1 


* I 


= ! I 


-k -1 


kx^x ^ 1 


= I C te I f[x\C£f[x 


-k -1 


(7.451) 


La loi de Pareto est par ailleurs bien une fonction de distribution puisque étant connue sa fonction de 
répartition: 


4oo 


J f(x)dx = 


(x ^ 
JL - 


k\ 


\ A / 


4co 




i- 5s. 

U®/ 


1_ ** 


\ X mJ 


= (1 - 0) - (l - 1* ) = 1 (7.452) 


L'espérance (moyenne) est donnée par: 


4oo 4<o .S- 4oo . 

t*=E(X)= J rf{x)dx= J 7k-^dx=h£ l \ dx 


K 1 


r+OO 


k -1 x k ~ l 


k ' 

k~ 1 


(7.453) 


si k > 1 • Si k < 1, l'espérance n'existe pas. 

Pour calculer la variance, en utilisant la relation: 

V{X) = E{X 2 }-E(xf ( 7 . 454 ) 


Nous avons: 


-Ko -Ko . 

e{x 2 )= J x 2 f{x)dx = kx k m \ - T=[ dx = - 


kxl 

k-2 


i-Ko 


k-2 


k- x^ 
k-2 


(7.455) 


si k > 2 • Si k < 2, E^X 2 J n'existe pas. 
Donc si k > 2 : 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


402/4839 








































Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


o 2 = V{X) = 


*■4 

k-2 


U-U 


*4 

(A:-!) 2 (i-2) 


(7.456) 


Si £ < 2, la variance n'existe pas. 

Voici un exemple de tracé de la fonction de distribution et répartition pour la fonction de Pareto de 
paramètre (x, x m ,k) = (x, 1,2): 



Figure: 7.23 - Loi de Pareto (fonction de distribution et de répartition) 


Remarque : Il faut noter que lorsque k —>+oo la distribution s'approche de ô(x- x m ) où S est la 
fonction Delta de Dirac. 


Il existe une autre manière importante de déduire la famille des lois de Pareto qui permet de 
comprendre bien des choses concernant d'autres lois et qui est souvent présentée de la façon suivante: 

Notons xq le seuil au-delà duquel nous calculons l'espérance de la quantité examinée, et E( Y) 
l'espérance au-delà de ce seuil xq tel qu'il soit proportionnel (linéairement dépendant) au seuil choisi: 


E(Y) = axQ+b (7.457) 

Cette relation fonctionnelle exprime l'idée que la moyenne conditionnelle au-delà du seuil x 0 est un 
multiple de ce seuil à une constante près, c'est-à-dire une fonction linéaire de ce seuil. 

Ainsi, en gestion de projets par exemple, nous pourrions dire qu'une fois une certain seuil de durée 
dépassé, la durée espérée est un multiple de ce même seuil à une constant près. 

Si une relation linéaire de ce type existe et est bien vérifiée, nous parlons alors de distribution de 
probabilité sous la forme d'une loi de Pareto généralisée. 

Considérons l'espérance mathématique de la fonction conditionnelle bayésienne donnée par (cf. 

chapitre de Probabilités): 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


403/4839 





















Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

1 ^ 

W) = ——T— - I yf'y'ày (7.458) 

P<X>x 0 \ - 

Si nous notons F(y) , la fonction de répartition de f(y), nous avons alors par définition: 

dF(y) = fy)dy (7.459) 

Dès lors: 

1 ^ 

£(?) = -—-— \ydF O) (7.460) 

P' X> I ■ 

et si nous définissons: 

= P{.X> *o) = l"^lW (7.461) 
que nous pouvons assimiler à la "queue de la distribution". 

Il vient: 

1 ^ 

B(Y) = =—\ydF(y) (7.462) 

*Oo) ; 

et donc nous cherchons le cas très particulier où: 

1 ^ 

—— I ydF(y) = ax + b (7.463) 

^ * 

c'est-à-dire: 


+00 


ydF(ÿ) = i ax + b <F(x) (7.464) 


En dérivant par rapport à x, nous trouvons: 


d 

dx 


+00 


ydF(y) 


x 


d 

dx 


<ax + b<F(x) i (7.465) 


La dérivée de l'intégrale définie ci-dessus sera la dérivée d'une constante (valorisation de l'intégrale en 
+ 00 ) moins la dérivée de l'intégrale de l'expression analytique enx. Nous avons donc: 


d 

dx 


+00 

J ydP(y) 

\ X / 


,| . J f +00 

d 


dx 


\ 


I yf(y)dy 

X / 


d.F(x) - , dF(x) 

- -xf{x) = -x -= aF (x) + ' ax + b < —;— (7.466) 


dx 


dx 


Soit: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


404/4839 


















Vincent ISOZ [v3.0-2013] 


et comme: 


[SCIENCES.CH] 


dF (x) — 

-x - = aF(x) + ' ax + b ' 

dx 


dFjx) 

dx 


(7.467) 


dF = d{\-F) = -dF (7.468) 

Il vient: 

dF{x) =. , dF(x) 

x -= aF (x) + 'ax + b' - (7.469) 

dx dx 

Après simplification et réarrangement nous obtenons: 

aF(x)dx =-> x(a-ï) + b <dF(x) (7.470) 

qui est donc une équation différentielle en F(x) . Sa résolution fournit toutes les formes 
Pareto recherchées, selon les valeurs que prennent les paramètres a et b. 

Pour résoudre cette équation différentielle, considérons le cas particulier où a > \,b = 0 
alors: 


En posant: 


aF(x)dx = -x(a -1 )dF(x) (7.471) 


Nous avons alors: 


k = (7.472) 

a -1 


et donc: 


Il vient: 


et donc: 


Nous avons: 


- — dx - — -=}■—dF (x) 
x k F(x) 


(7.473) 


-ln(x) = -lm + 
k 


(7.474) 



= g 


—ln> F(x) i +c t£ 
Je 


= s 


—In' F(x) I 


s 




(7.475) 


f v i 

flj = j î (x)* -c fe (7 - 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


de lois de 


. Nous avons 


405/4839 












Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


f Je ^ ,, 


F(x) = 


\ * J 


2 » 

* J 


(7.477) 


Il vient alors pour la fonction de répartition: 


/ 

F(x) = \-F(x) = \- 

\ x 


(1.41%) 


Si nous cherchons la fonction de distribution, nous dérivons par x pour obtenir: 

fU)= d JFL = k 4r ( 7 . 479 ) 

dx x *+l 

Il s'agit de la loi de Pareto que nous avons utilisée depuis le début et nommée "distribution de Pareto de 
type I" (nous ne montrerons pas sur ce site celles de type II). 

Une chose intéressante à observer au passage est le cas de la résolution de l'équation différentielle: 

aF(x)dx -x(a-V) + b >dF(x) (7.480) 
lorsque a = \,b > 0. L'équation différentielle se réduit alors à: 


Soit: 


Après intégration: 


F(x)dx = -bdF(x) (7.481) 


--dx=^J—dF(x) (7.482) 

b F{x) 


X = ln I .F (x) I (7.483) 

b 


et donc: 


(7.484) 


F(x) = e b 

Si nous faisons un petit changement de notation: 

F(x) = e~* x (7-485) 

et que nous écrivons la fonction de répartition: 

F(x) = l-F(x) = J l-e~ Xx (7-486) 

Et en dérivant nous obtenons la fonction de distribution de la loi exponentielle: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


406/4839 
















Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

F(x) = fa~* x (7-487) 

Donc la loi exponentielle a une espérance conditionnelle seuil qui est égale à: 


E(Y) = ax a +b = +b = *o + ~ = Pi + ~ = *0 + a 
a=\ A À 

X 


(7.488) 


Donc l'espérance conditionnelle seuil est égale à elle-même augmenté de l'écart-type de la distribution. 
5.14. FONCTION EXPONENTIELLE 


Nous définissons la "fonction exponentielle" (ou "loi exponentielle") par la relation de fonction de 
distribution suivante: 


P{x) =Â'e~ Ax 


■1 


[0,-H 


(7.489) 


avec A > 0 qui comme nous allons de suite le montrer n'est au fait que l'inverse de la moyenne et où x 
est une variable aléatoire sans mémoire. 


Au fait la loi exponentielle découle naturellement de développements très simples (voir celui dans le 
chapitre de Physique Nucléaire par exemple) sous des hypothèses qui imposent une constance dans le 
vieillissement d'un phénomène. Dans le chapitre des Techniques de Gestion, nous avons aussi démontré 
en détails dans la partie concernant la théorie des files d'attentes, que cette loi était sans mémoire. 
C'est-à-dire que que la probabilité cumulée qu'un phénomène se produise entre les temps t et t+s s'il ne 
s'est pas produit avant est la même que la probabilité qu'il se produise entre les temps 0 et s. 


Remarques : 

RI. Cette fonction se retrouve fréquemment en physique nucléaire (voir chapitre du même nom) ou 
encore en physique quantique (voir chapitre du même nom) ainsi qu'en fiabilité (cf. chapitre de 

Génie Industriel) ou dans la théorie des files d'attentes (cf. chapitre de Techniques de Gestion). 

R2. Nous pouvons obtenir cette loi dans la version française de Micrsosoft Excel 11.8346 avec la 
fonction LOI.EXPONENTIELLE( ). 


Il s'agit par ailleurs bien d'une fonction de distribution car elle vérifie: 


-Ko +:o -Ko 

J (x)dx = J Ae * x dx — A j s ix dx- A 


-0Q 


0 


0 



A) 


o 


- e~° x ) = -(0 - 1) = 1 (7.490) 


La fonction exponentielle a pour espérance (moyenne) en utilisant l'intégration par parties: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


407/4839 













Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 



x • A • e 2 *dx = -e 


-A X 


+rjl. 


-e üfr 


-hc -| |-ho 



I 


(7.491) 


et pour variance (nous utilisons à nouveau V(X) = E{X 2 ) - E(XŸ ) et il ne nous reste plus qu'à 
calculer: 


-kii' 

E(X 2 ) = [Ax^dx (7.492) 


t 


Un changement de variable y = Ax => dy - Adx conduit à: 


E(X 2 )=^^y 2 e~ y dy (7.493) 


Une double intégration par parties donne: 

\f{t)g'{t)dt = f{t)g{t)l -^f\t)g{t)dt 

a. a. 

J* y 2 e~ y dy = ~y 2 e~ y £ + 21 ye~ y dy = 2 | Q j + 21 e~ y dy = 2 

D'où E[X 2 J = 2 / A 2 il vient dès lors: 


(7.494) 


V(X) = E(X 2 )-E(xf 

A 




= J_ (7.495) 


Donc l'écart-type (racine carrée de la variance pour rappel) et la moyenne ont exactement la même 
expression! 


Voici un exemple de tracé de la fonction de distribution et répartition pour la fonction exponentielle de 
paramètre A = 1 : 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


408/4839 








Vincent ISOZ [v3.0-2013] 



Figure: 7.24 - Loi exponentielle (fonction de distribution et de répartition) 

Déter min ons maintenant la fonction de répartition de la loi exponentielle: 


P{x <}>Q 

/ -Ax 
= -( e 


\Ae~* î dt= Â\e~ M dt = A- 





/o 



1- s 


-Ax 



(7.496) 


Remarque : Nous verrons plus loin que la fonction de distribution exponentielle n'est qu'un cas 
particulier d'une fonction plus générale qui est la fonction du Khi-deux, cette dernière aussi n'étant 
qu'un cas particulier d'une fonction encore plus générale qui est la fonction Gamma. Il s'agit d'une 
propriété très importante utilisée dans le "test de Poisson" pour les événements rares (voir plus loin 
aussi). 


5.15. FONCTION DE CAUCHY 


Soient X,Y deux variables aléatoires indépendantes suivant des lois Normales centrées réduites 
(variance unité et espérance nulle). La fonction de densité est donc donnée par: 


fx( x ) = JrOO = 


1 

J- Ti 


•Jln 


(7.497) 


La variable aléatoire: 


t= Y\ (7498) 

(la valeur absolue intervient dans l'intégrale lors du changement variable) suit une allure caractéristique 
appelée "fonction de Cauchy" (ou "loi de Cauchy") ou encore "loi de Lorentz". 

Déterminons sa fonction de densité/. Pour cela, rappelons que/est déterminée par la relation 
(générale): 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


409/4839 



















Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


Vt e]&,P(T<t)= J f(x)dx (7.499) 

-00 

Donc (application du calcul intégral élémentaire): 

f(t)=^P(TU) (7.500) 

dt 

dans le cas où/est continue. 

Etant donné que X et Y sont indépendants, la fonction de densité du vecteur aléatoire est donnée par un 
des axiomes des probabilités (cf. chapitre de Probabilités): 

(x,y) R- f x (x) ■ J Y {ÿ) (7.501) 


Donc: 


P{T<t) = P 


X . 

]—r < t 

|r| 


-Pix<i |i'|) - f/rWAO )dxfy 


(7.502) 


où donc D = [(x, 7 ) | x < t 1 [y(J . 
Cette dernière intégrale devient: 




\jx { p")JY ( x) dxd y = J J fxi x )'fyxfady 

J_j -00 -oo 


(7.503) 


Faisons le changement de variable x = u ■ [y| dans l'intégrale intérieure. Nous obtenons: 


+oo f 


t +00 


P(T<t) = 1 ■ \y\p f Y (y)'\y\' dud y = S / AO. ■ \y |) ' /y (y) ' \y\ ■ dydu (7.504) 


Donc: 


+00 +» ~ y 2 ( t 2 + 1 ) 

/(O = — P ( J < P) = J fx ( -P ' M 'fr(?)'\?\'dy= — je 2 ' \y \ 1 dy ( 7 - 505 ) 


C'est maintenant que la valeur absolue va nous être utile pour écrire: 


1 -A 2+ P i o -y 2 u 2+ l) , ^ ~j 2 ù 2+ i) 

f{t )=— f e 2 \y\dy = ~— te 2 ydy + - fe 2 ydy (7. 

2x1 l 


Pour la première intégrale nous avons: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


410/4839 












Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


o -A 2 +d 
J <? 2 ydy =-'■ 


-j-V+U 


t 2 +1 


1 +^-3—= 0 (7.507) 


t 2 + 1 i 2 +l 


Il ne reste donc plus que la seconde intégrale et en faisant le changement de variable v= y 2 , nous 
obtenons: 


1 


■K» - v(î 2 +l) 


/(0=—Je 2 M dv = -- 


1 




1 


7r(t 2 + l) 


(7.508) 


2zr J +lj 

Ce que nous noterons par la suite (afin de respecter les notations adoptées jusqu'à présent): 

(7.509) 


P(X) = 


1 1 


JT 1 + X 2 


et qui n'est d'autre que la fonction de Cauchy. 

Il s'agit par ailleurs bien d'une fonction de distribution car elle vérifie (cf. chapitre de Calcul Différentiel 
et Intégral): 

-Kii' | -kij | | 

J P{x)dx = — J - - -dx = — • (arctan(+°o) - arctan(-™)) = 1. (7.510) 


Voici un exemple de tracé de la fonction de distribution de Cauchy: 



Figure: 7.25 - Loi de Cauchy (fonction de distribution) 

La fonction de Cauchy a pour espérance (moyenne): 

[Vincent ISOZ] | http://www.sciences.ch] | Page: 


411/4839 






















Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


o 




-dx + 


+ .r 


î 


X 

Ü? 


T 

dx 


= ^(ln(l + * a )L +ln(l+^)|") = ^:(ln(l)-ln(œ) + ln(œ)-ln(l)) < 7 - 511 ) 

= f-ln(m) + ln(°°)) = 0 

Attention! ! ! Les calculs précédents ne donnent pas zéro au fait car la soustraction d'infinis est non pas 
nulle mais indéterminée! La loi de Cauchy n'admet donc pas d'espérance rigoureusement parlant! 

Ainsi, même si nous pouvons bricoler une variance: 


o 2 = f (* " VŸ ■ f(x)dx = f z 2 P{x)dx = — f -^—jdx =-■ f (1 - —^)dx = 

J JL 7t JLi + r 7ï 1 1 + r 

—TiZ' 

f 1 

■ lim f(l-- 

] + 


(7.512) 


2 

n 


1 2 

-^)dx = — ■ lim (t - arctan(£)) = +m 


jr 

celle-ci est absurde et n'existe rigoureusement parlant pas puisque l'espérance n'existe pas...! 
5.16. LOI BÊTA 


Rappelons d'abord que la fonction Gamma d'Euler est définie par la relation (cf. chapitre de Calcul 
Différentiel Et Intégral): 


+QD 


r»- 




x* 1 dx 


(7.513) 


Nous avons démontré (cf. chapitre de Calcul Différentiel Et Intégral) qu'une propriété non triviale de 
cette fonction est que: 


T(z + 1) = z • T(z) (7.514) 


Posons maintenant: 


r (ûf) ■ r(£) = bm ffe 1 y x°- y l dxdy / 7 515) 

+CÙ JJ 
-4 


où: 


A R = {(x.jOl* > 0,y 1 0,x + y < (7. 


En faisant le changement de variables: 



(7.517) 


nous obtenons: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


412/4839 
















Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


R u 


r(a)' r(è) = lim ITe * l y b l dxdy = lim 
j?il— + -Kii' JJ J?—++Ü 

Pour l'intégrale interne nous utilisons maintenant la substitution v = u ■ t (0 < t < 1) et nous trouvons 
alors: 


“ (| (a - v) a 1 v # 1 dv)du (7. 


T (a) ■ Y (b) = hin jV* (j*(a - v'f- l v'- l dv)du = Hm [e^u^du ■ f (1 - t^h^dt 


j(l- 




(7.519) 


= B(a,b)- ^u^du = B(a,b)-r(a + b) 


La fonction B qui apparaît dans l'expression ci-dessus est appelée "fonction bêta" et nous avons donc: 

(7.520) 


B(a,b) 


r (a)-r(è) 


r(a +b) 


Maintenant que nous avons défini ce qu'était la fonction bêta, considérons deux paramètres 
a > 0,£ > 0 et considérons la relation particulière ci-dessous comme étant la "fonction de distribution 
bêta" ou "loi bêta" (il existe plusieurs formulations de la loi bêta dont une très importante qui est 
étudiée en détails dans le chapitre de Techniques de Gestion): 


ou: 



B(a,b) V[ 


] 

B(a,b) = j 

1 (1 - xŸ 1 dx 


(7.521) 


(7.522) 


Nous vérifions d'abord que que Z* (x) est bien une fonction de distribution (sans trop aller dans les 
détails...): 


-Ne -hc £L-l/-i _ \*-l 


(1 - xŸ~ l 

s? A ]oa[ 


1 +ï. -, -, 

= — - tf-'dx = —B{a,b) = —c* = 1 

Maintenant, calculons son espérance (moyenne): 

„ o f 1 !> a fl ^-Îj B{a + \,b) 

r(fl+l)-r(i) Y(a + b) a 


(7.523) 


(7.524) 


r(a+£ + l) r(fl)T(i) (a+b) 


en utilisant la relation: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


413/4839 



















Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


T(z + 1) = z ■ T{z) (7.525) 


et sa variance: 


o 3 = 


f (* - UŸ 1 f(x)dx = f (x “ /O 2 - xŸ-'dx 

_i B (a,b) ^ 


1 


B(a,b) 


II 


x tt+1 (l - x) iA dx - 2/jjx tt (l - xf-'dx+tf 1 fx tt_1 (l - xŸ~ l dx 


+fl T 


(7.526) 


= ■ [B(a + 2 ,b)~ 2 SB(a,b) + /: 2 i?(fl,à)) = ■ (ü(a + 2,i) - 

rr^ï ) 1 rr^) 

En sachant que T(z + 1) = z ■ T(z) et que B (a, b) =-- nous trouvons: 

r(a + b) 

B(a + 2,b) = ^' (û ; + 1) . B(a,b) (7.527) 
a + b +1 

et donc: 


^ = A'(a + 1) 2 = 

a+b + 1 


flè 


(a + A) J (a +i + l) 


(7.528) 


Exemples de tracés de la fonction pour (a,b) = (0.1,0.5) en rouge, (a,b) = (0.3,0.5) en vert, 

(a, à) = (0.5,0.5) en noir, (a,b) = (0.8,0.3) en bleu, (a,b) = (1,1) en magenta, (a,b) = (1,1.5) encyan, 
(a, b) = (1,2) en gris, (a, à) = (1.5,2) en turquoise, (fl,&) = (2,2) en jaune, (a, à) = (3,3) en couleur or: 



Figure: 7.26 - Loi bêta (fonctions de distribution) 

et tracé de la fonction de distribution et répartition de la loi bêta de paramètres (a,b) = (2,3) : 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


414/4839 
























Figure: 7.27 - Loi bêta (fonction de distribution et de répartition) 

5.17. FONCTION GAMMA 


La fonction Gamma d'Euler étant connue, considérons deux paramètres a > 0, A > 0 et définissons la 
"fonction Gamma" (ou "loi Gamma") comme étant donnée par la relation: 


^ (*) = 


-kii' ]Ü,-Hd[ 

0.-1 -J* , 


l 


x^s^dx 


(7.529) 


En faisant le changement de variables t = Ax nous obtenons: 

7 a-i - xk , r C a ) 

\x s dx = —— (7.530) 

i À 

et pouvons alors écrire la relation sous une forme plus classique que nous trouvons fréquemment dans 
les ouvrages: 



(7.531) 


et c'est sous cette forme que nous retrouvons cette fonction de distribution dans la version française de 
Microsoft Excel 11.8346 sous le nom LOI.GAMMA( ) et pour sa réciproque par 
LOI.GAMMA.INVERSE( ). 


Si a e N, la loi Gamma au dénominateur devient (cf. chapitre de Calcul Différentiel Et Intégral) la 
factorielle \a - 1Ü. La fonction Gamma peut alors s'écrire: 


3u<*) = - 


x aA r e -' u 

.a-l.! 


■ xA ï 


a -1 


f fl — li! 


■ Ae~ lx (7-532) 


Cette forme partiuclière de la fonction de distribution de la fonction Gamma s'appelle alors la "fonction 
d'Erlang" que nous retrouvons naturellement dans la théorie des files d'attentes et qui est donc très 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


415/4839 




















Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

importante dans la pratique! 


Remarque : Si a = 1 alors r(üs) = 1 et ^ û_1 = \ et nous retombons sur la loi exponentielle. 


Ensuite, nous vérifions avec un raisonnement similaire en tout point à celui de la fonction bêta que 
(x) est une fonction de distribution: 


J F t ^ (x')dx = 1 (7.533) 

Exemples tracés de la fonction de distribution pour (a. A) = (0.5,1) en rouge, (a. A) = (1,1) en vert, 
(a. A) = (2,1) en noir, (a. A) = (4,2) en bleu, (a. A) = (16,8) en magenta: 



Figure: 7.28 - Loi Gamma (fonction de distribution) 

et tracé de la fonction de distribution et répartition pour la fonction Gamma de paramètres 
(<U)=(4,1): 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


416/4839 













Figure: 7.29 - Loi Gamma (fonction de distribution et de répartition) 


La fonction Gamma a par ailleurs pour espérance (moyenne): 


-ho 


fit = jx'f(x)dx 

-CD 


r(a) J r<a) a * +1 


A* aY{a) 

F(7) T +1 


a 

~ (7.534) 

A 


et pour variance: 




(x ~ pi) 2 1 x a ^ A *dx 




^x a+1 e~ A *dx + v 2 J- 0 " 1 - - * 


x a+L e~ A *dx + pi* \x°- l e~ A *dx - 2 fit tx*e~ A *dx 


A* fr(a + 2) + ^ T(a) _ 2 ^r(a + i) 


T(a) ^ ,ï 


■1Û.+2 


■nû+1 


f 

1 ! j -( r ( g + 2) + a J rw - 2ar( fl + 1)) 


(7.535) 


r(a) ■ ;ï 


5- ((a +1) ■ a ■ r(a) + « 2 r» - 2 ü 2 r(a)) = 4 


Démontrons une propriété de la fonction Gamma qui nous servira à établir plus tard dans ce chapitre, 
lors de notre étude de l'analyse de la variance et des intervalles de confiance sur des petits échantillons, 
une autre propriété extrêmement importante de la loi du Khi-deux. 

Comme nous le savons, la fonction de densité d'une variable aléatoire suivant une fonction Gamma de 
paramètres a, A > 0 est: 


-A* ü-1 

p a,:\ O) = /(*)= (7.536) 

avec (cf. chapitre de Calcul Différentiel Et Intégral) la fonction Gamma d’Euler: 

+:o 

r(a) = J e *x a l dx (7.537) 

0 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


417/4839 




























Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

Par ailleurs, quand une variable aléatoire suit une fonction Gamma nous la notons: 

X=y{a,X) (7.538) 


Soient X, Y deux variables indépendantes. Montrons que si X = y{p,A) et 7 = y{q, A) alors: 

X+Y=y{p+q,A) (7.539) 

Notons /la fonction de densité du couple (X, Y), j' x la fonction de densité de X et j Y la fonction de 
densité de Y. Vu que X, Y sont indépendantes, nous avons: 

f(xÿ) = Jx(x) ■ J Y (y) (7.540) 


pour tout x, y > 0 . 

Soit Z - X +Y ■ La fonction de répartition de Z est alors: 

F{z) = P{Z<z) = P{X + Y<z)=\\ f{x,y)dxdy (7 541) 

D 

où D = {(x,.y) I x + y <z] . 


Remarque : Nous appelons un tel calcul une "convolution" et les statisticiens ont souvent à 
manipuler de telles entités ayant à travailler sur de nombreuses variables aléatoires qu'il faut 
sommer ou même multiplier. 


En simplifiant: 

-Ko*-a 

F{z)=\ \ Ix{ x ) J Y (y)dydx (7. 

-0Q -OO 


Nous effectuons le changement de variable suivant: 


x = x 

(7.543) 

7 = 


Le jacobien est alors (cf. chapitre de Calcul Différentiel Et Intégral): 


dx 

dx 

d .ï 

ds 



dx 

ds 


1 

-1 



(7.544) 


Donc avec la nouvelle borne d'intégration s=x+y = x + (z-x) = z nous avons: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


418/4839 












Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


4® i s -t®° 

F{z)= \ } ;'jW' fy{s~ x)dsdx = J J fx( x ) ■ fy ( s “ x ) dxd ^ (7-545) 

-00 -00 -00 -00 

Si nous notons g la fonction de densité de Z nous avons: 

Z -KC' S 

^(z)= J J fx ( - x ) ' /l' 'A “ x)dxds = J g(»dfe (7.546) 

-00-00 -oo 

Par suite: 

-HD 

g (s) = J fxi x ) fy 0 “ x ) dx ( 7 - 

-OO 

Sx et Sy étant nulles lorsque leur argument est négatif, nous pouvons changer les bornes d'intégration: 


g (s) = f fx( x ) ■ fy( s ~ x ) dx pour s> 0 (7.548) 

0 

Calculons g: 


g(s) = 


A p+q e~ À1 - 


JV 1 (s - x) q 1 dx (7.549) 


np)-m 


Après le changement de variable x = st nous obtenons: 
A p+q e~ ls 1 


g( s ) = 


r^)-r(ï) 


s p ^- l \t pA {\-t) q dt^ 


A p ^s~ À1 

WW 


s p+q 1 ■ B(p,q) (7.550) 


où B est la fonction bêta que nous avons vue plus haut dans notre étude de la fonction de distribution 
bêta. Or nous avons aussi démontré la relation: 




rfr)r(g) 

T{p+q) 


(7.551) 


Donc: 


S ( fî ) 


r( P +q) 


(7.552) 


Ce qui finalement nous donne: 


P{Z <z) = P{X + Y <z)=\g(s)ds = \ 

0 0 


A p+q s~ i! 

r {p+q) 


s p ^~ l ds 


(7.553) 


Ce qui montre que bien que si deux variables aléatoires suivent une fonction Gamma alors leur somme 
est aussi telle que: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


419/4839 












Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


X + Y=y{p+q,À) (7.554) 


Donc la fonction Gamma est stable par addition de même que le sont toutes les lois qui découlent de la 
loi Gamma et que nous allons aborder ci-après. 


5.18. FONCTION DE KHI-DEUX (OU DE PEARSON) 


La "fonction de Khi-deux" (appelée aussi "loi du Khi-deux" ou encore "loi de Pearson") n'est par 
définition qu'un cas particulier de la fonction de distribution Gamma dans le cas où a =kS 2 et 
A = 1/ 2 , avec k entier positif: 





W (7-555) 


Cette relation qui relie la loi du Khi-deux à la loi Gamma est importante dans la version française de 


Microsoft Excel 11.8346 car la fonction LOI.KHIDEUX( ) donne le seuil de confiance et non la loi de 
distribution. Il faut alors utiliser la fonction LOI.GAMMA( ) avec les paramètres donnés ci-dessus (à 
part qu'il faut prendre l'inverse de 1/2, soit 2 comme paramètre) pour avoir la fonction de distribution et 
de répartition. 

Le lecteur qui voudra vérifier que la loi du Khi-2 est un cas particulier de la loi Gamma, pourra écrire 
dans la version française de Micrsoft Excel 14.0.6123: 


LOI.KHIDEUX.N(2*x;2*Â:;VRAI) 
=LOI.GAMMA.N(x;Æ; 1 ;VRAI) 


Tous les calculs faits auparavant s'appliquent et nous avons alors immédiatement: 

fi = k, CT 2 = 2k (7.556) 

Exemples de tracés de la fonction de distribution pour k = 1 en rouge, k = 2 en vert, k = 3 en noir, 
k = 4 en bleu: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 










Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 



Figure: 7.30 - Loi du Khi-deux (fonctions de distribution) 

et tracé de la fonction de distribution et respectivement de répartition pour la loi du Khi-deux pour 
k = 2: 


0L1& 



Figure: 7.31 - Loi du Khi-deux (fonction de distribution et de répartition) 

Dans la littérature, il est de tradition de noter: 

X=Z 2 k OUX=Z 2 {k) (7.557) 


pour indiquer que la distribution de la variable aléatoire X est la loi du Khi-deux. Par ailleurs il est 
courant de nommer le paramètre k "degré de liberté" et de l'abréger "ddl". 

La fonction Khi-deux découle donc de la loi Gamma et par ailleurs en prenant k-2 nous retrouvons 
aussi la loi exponentielle (voir plus haut) pour 2 = 1 / 2 : 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


421/4839 

















Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


D , , 1 2/2-1 -jt /2 1 -ï/2h 

^ * = ® V*»[ ( 7 - 558 > 

Par ailleurs, puisque (cf. chapitre de Calcul Différentiel Et Intégral): 

r(l/2) = «JïT (7.559) 


la loi du Khi-deux avec k égal à l'unité peut s'écrire sous la forme: 

1 1H-3-1 -ïV9 1 


P 2 O) = ~TJX 

2 1 ' 2 17(1/2) 


1 / 2-1 -xl 2 

x e 


'■J2. 


nx 


3 (7.560) 


Enfin, terminons avec une propriété assez importante dans les tests statistiques que nous étudierons un 
peu plus loin et particulièrement dans les invtervalles de confiance des événementes rares. 
Effectivement, le lecteur pourra vérifier dans un tableur comme Microsoft Excel 14.0.6123 (version 
française), que nous avons: 


= LOI. P OIS S ON. N(x e NAVRAI) 

= 1 -LOI. KHIDEIIX. N( 2*pi\ 2 * (x +1); VRAI) (7.561) 
=1 -LOI. GAMMA. N(/t; x+\, VRAI) 


Il nous faut donc démontrer cette relation entre loi du khi-2 et loi de Poisson. Voyons cela en partant de 
la loi Gamma: 


« = 


r(a) 


(7-562) 


Si nous posons ;i = 1 / 2 et a=k ! 2 nous avons alors la loi du khi-2 à k degré de libertés: 


^(*) = 


1 


2 k/2 ■ T(k/ 2) 


Æ -/ 2—1 — iï /2 f 
7l & ^[0 n -hE.[ 


Maintenant, rappelons que nous avons vu dans le chapitre de Suites Et Séries, la série de Taylor 
(Maclaurin) avec reste intégral à l'ordre n -1 autour de 0 jusqu'à X suivante: 


h -1 jk ■* 

e Jt = T— e x (0)+\e”£ - 


x-tP~ l _ ( l ! x k À - 


H-l 


-di - "V P— + | e n (t) - dt 

r 0 * ! 0 («- 1 )' 


h- 1 nfc 0 h-1 h- 1 nfc h-1 

= yi-[«*-“ ±—du = y—+ f «*-" -—àu 


(7.564) 




fc=0 0 («- 1 )! 


Nous multiplions par : 


-À ^ -X 
e e = e 


h-1 yk A 

f À-u u 


h-1 


\ 


Z^r+J 


-du 


v *=0* ! 0 («- 1 )! , 


H-1 2 & H-1 

=> 1 = 'T' — e ^ + \ e u - du 

o ("-D ! 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


422/4839 




















Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


Et donc: 


h-1 nk A h-1 

T —e~ X = 1- f —- du (7.566) 

*To* ! o 


Or, concentrons-nous sur le terme: 


f u 


H-l 


(*-!)! 


-du (7.567) 


et faisons un premier changement de variable: 

J! H—1 À 

|V U -Î^—-J- x^ l e~ xl2 -dx=\ - - - x^e-^dx (7.568) 

Q («-1)! u=x!2 2” -1 («-1)! 2 Q 2>-1)! 

et un second changement de variable (attention! le k dans le changement de variable n'est pas le même 
que celui de la somme de la loi de Poisson...): 


f- i 

0 2>-l)! 




dx = | 


1 


n=m ü 2 k!2 

y 2 


-x^e-^dx 


(7.569) 


Or, nous avons démontré dans le chapitre de Calcul Différentiel Et Intégral que si x est un entier 
strictement positif: 


Il vient alors: 


*! = nx+l) (7.570) 


f*-ikr 
U ) 


ffh. \ \ 


*-l 

j 


+ 1 


/ 


= r l — I 


Nous avons finalement: 


2^/2-i r, * / 2. 


x m-\ g -x/2 dx (7.572) 


où nous retrouvons donc bien la fonction de distribution du khi-2 sous l'intégrale! Donc au final: 


1 


H-l nk 

T.—e~ X =\- \- kn 
i^ 0 k\ ' Q 2 k/2A T, kf 2, 


x k/2A e~ x/2 dx (7-573) 


D'où la relation donnée plus haut pour les tableurs! 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


423/4839 




















Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


5.19. FONCTION DE STUDENT 

La "fonction de Student" (ou "loi de Student") de paramètre k est définie par la relation: 



(7.574) 


avec k étant le degré de liberté de la loi du Khi-deux sous-jacente à la construction de la fonction de 
Student comme nous allons le voir. 

Indiquons qu'elle peut aussi être obtenue dans la version français de Microsoft Excel 11.8346 à l'aide 
des fonctions LOI.STUDENT( ) et sa réciproque par LOI.STUDENT.INVERSE( ). 

Il s'agit bien d'une fonction de distribution car elle vérifie également (reste à démontrer directement 
mais bon comme nous allons le voir elle est le produit de deux fonctions de distribution donc 
indirectement...): 


J P y {x)dx = 1 (7.575) 


Voyons la démonstration la plus simple pour justifier la provenance de la loi de Student et qui nous sera 
en même temps très utile dans l'inférence statistique et l'analyse de la variance plus loin. 

Pour cette démonstration, rappelons que: 

Rl. SiX, Y sont deux variables aléatoires indépendantes de densités respectives f x ,f 7 , la loi du couple 
(X,Y) possède une densité/vérifiant (axiome des probabilités!): 

f(x,y)=fx(x) fï(y) ( 7 - 576 ) 


R2. La loi N( 0,1) est donnée par (voir plus haut): 


/(*) = 


1 






(7.577) 


R3. La loi ^ est donnée par (voir précédemment): 


/ ty) = „a \ - yf2 y 2 1 (7.578) 

K / 2 B ^r(«/2) 


pour y > 0 et n > 1 • 

R4. La fonction r est définie pour tout a > 0 par (cf. chapitre de Calcul Différentiel et Intégral): 

-ho 

T(a)= \e r x a l dx (7.579) 

0 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


424/4839 














Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

et vérifie (cf. chapitre de Calcul Différentiel et Intégral): 


r(«-i) = 


a -1 


(7.580) 


pour a> 2. 

Ces rappels étant faits, considérons maintenant X une variable aléatoire suivant la loi iV(0,l) et Y une 
variable aléatoire suivant la loi . 

Nous supposons X et Y indépendantes et nous considérons la variable aléatoire (c'est à l'origine l'étude 
historique de la loi de Student dans le cadre de l'inférence statistique qui a amené à poser cette variable 
dont nous justifierons l'origine plus loin): 


'T r x x 
T =v« -f= = -j= (7.581) 

-y/Y "JŸ i n 

Nous allons montrer que T suit une loi de Student de paramètre n. 

Démonstration: 

Notons F et/ les fonctions de répartition et de densité de T et f x , f Y / les fonctions de densité de X, 
Y et (X,Y) respectivement. Nous avons alors pour tout /el: 


F(t) = P(T<t) = P^/ïïX<tJ = llf(x r y)d X rfy 


JJa {x) ■ /v (Vl dxdy (7.582) 


où: 


D = \(x,y)e]&xm + \x<^jîi\ (7.583) 

la valeur imposée positive et non nulle de y étant due au fait qu'elle est sous une racine et en plus au 
dénominateur. 


A in si: 


-Kil' tfît-Jx -Kil' 

F CO = fv (y) dxd y =\ fv (^) f fx( x ) dxd y = J fl ( 7 ) 4n)dy (7. 

D 0 —gd 0 

où comme X suit une loi tV(0,1): 

(7.585) 

iV2^ 

est la fonction de répartition de la loi Normale centrée réduite. 

Nous obtenons alors la fonction de densité de T en dérivant F: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


425/4839 










Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


H -Kl!' 

f(t) = F'{t) = -j= J f Y {y)f x [tyfÿ!-Jn)^ÿdy (7. 


car (la dérivée d'une fonction est égale à sa dérivée multipliée par sa dérivée intérieure): 




■fy 


dt 




(7.587) 


Donc: 


+CÛ 

f{ t ) = ~r J &{y)fx[ l 4ÿ ! 
V» o 


1 1 


_ 1 T 1 

“^1 2 H/ 3 r(«/2) e ^ V2^' 


(^/#) 


2 S/ 2 r(«/2) y/2 


* », 

J 




4Î’d> 


(7.588) 


2 B/3 r(H/2)>/2ji : ^3 
En faisant le changement de variable: 


1 


y[ 1-tf 1 /«) 


H—1 


2 .,2 


^ 2 


7 

u - — 
2 


/ f 2 \ 
1+ — 

V »/ 


dy = 


y = 


f \ 

2 

V / 

/■■■ f 2\ 

1 +- 
__ 

2 

V / 


du 


(7.589) 


nous obtenons: 


H+l 


W + 1 


-hD M—1 


= _:_ _I_ f e~“u 2 du = _ v ^ y _I_-_ 

2 B/2 r(«/2)V27rV« \^+t 2 fn) J 0 2 B/2 r(w/2)V2zr^U + ^/». 


B+l 

\ O 




(7.590) 


M +1 


B+l 

e v~ 

i+- 

»/ 


r(«/ 2) 

ce qui est bien la loi de Student de paramètre n. 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


426/4839 


































Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


Voyons maintenant quelle est l'espérance de la loi de Student: 


X 


T=*Jn-= (7.591) 


Nous avons: 


e(t) = e(^x)eU= 


(7.592) 


/ 


Mais E 


77, 


existe si et seulement si n > 2 • En effet pour n = 1 : 


E 


H \ -Kil' H -I -Kil' H-3 

v?r <7593) 


et: 


-hD 1-3 -hD -v/t 1 -v/üi 1 h 

J e - '' 2 / 5 "^ = J - -> J -- dy > e -1 ' 2 J - dy = +oo (7.594) 


Tandis que pour n > 2 nous avons: 

-hd m-3 h-1-hd h-3 m-1 / 


J 2 = 2 2 J e^u 2 = 2 2 T 

0 0 


n -1 


<+oo (7.595) 


Ainsi pour n = 1, l’espérance n’existe pas. 

Donc pour ^ > 2 • 

= 0 (7.596) 

Voyons maintenant la valeur de la variance. Nous avons donc: 

V(T) = E{T 2 )-E(rf (7.597) 

Discutons de l'existence de -ff^T 2 J. Nous avons trivialement: 


x 2 '] , 




E{T i ) = nE - =nE(X 2 )E 

\ V 

X suit une loi normale centrée réduite donc: 


(7.598) 


w y 


□C.Q.F.D. 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


427/4839 


















Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


V{X) = 1= S(x 2 )-E(xf = E(X 2 )^E(X 2 ) = 1 


(7.599) 


Pour ce qui est de nous avons: 


E 


1 +rj -' 1 1 -I H _ 

— | = f —/y ( 7 ) û(y = — 77—7 -- f e~ yi2 y* dy =---- [ du 

v\ 2 s/2 r(«/ 2 ) J 0 2T(»/2)J 


r --1 


0 y 
\ 


(7.600) 


2T(»/2) 

où nous avons fait le changement de variable u = y S 2 . 

/» A 

Mais l'intégrale définissant r — -1 converge seulement si n > 3 . 

\2 } 

Donc E{T 2 ) existe si et seulement si n > 3 et vaut alors selon les propriétés de la loi Gamma d'Euler 
démontrées dans le chapitre de Calcul Différentiel et Intégral: 


r 


nE{T) = n 


f n — 2^ 


\ *■ J 


n 


2r(»/2) n - 2 


A in si pour « > 3 : 




n - 2 


(7.602) 


Il est par ailleurs important de remarquer que cette loi est symétrique par rapport à 0! 

Exemple de tracé de la fonction de distribution et répartition pour la fonction de Student de paramètre 
k = 3: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


428/4839 


















Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 



Figure: 7.32 - Loi de Student (fonction de distribution et de répartition) 

5.20. FONCTION DE FISHER 


La "fonction de Fisher" (ou "loi de Fisher-Snedecor") de paramètres k et / est définie par la relation: 



(7.603) 


si x > 0 • Les paramètres k et / sont des entiers positifs et correspondent aux degrés de liberté des deux 
lois du Khi-deux sous-jacentes. Cette distribution est souvent notée h.i ou F(kJ) et peut être obtenue 
dans la version française de Microsoft Excel 11.8346 par la fonction LOI.F( ). 

Il s'agit bien d'une fonction de distribution car elle vérifie également (reste à démontrer directement 
mais bon comme nous allons le voir elle est le produit de deux fonctions de distribution donc 
indirectement...): 


-HD 

J F k j {x)dx - 1 (7.604) 

0 

Voyons la démonstration la plus simple pour justifier la provenance de la loi de Fisher et qui nous sera 
en même temps très utile dans l'inférence statistique et l'analyse de la variance plus loin. 

Pour cette démonstration, rappelons que: 

Rl. La loi est donnée par (voir plus haut): 


f{y) = 


2 B ^T(«/2) 


™-l 


(7.605) 


pour y > 0 et n > 1 • 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


429/4839 

















Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

R2. La fonction r est définie pour tout a > 0 par (cf. chapitre de Calcul Différentiel et Intégral): 

-Kil' 

r(a) = J e^x^dx (7.606) 

0 

Soient X, Y deux variables aléatoires indépendantes suivant respectivement les lois j 2 et ^ . 
Nous considérons la variable aléatoire: 


F = 


X ! n 
Thn 


(7.607) 


Nous allons donc montrer que la loi de T est la loi de Fisher-Snedecor de paramètres n, m. 


Notons pour cela F et/ les fonctions de répartition et de densité de T et les fonctions de 

densité de X, Y et (X,Y) respectivement. Nous avons pour tout t e IR : 


F{t) = P(T<t) = P = JJ/ (x,y)dxdy = JJ f x {x)■ f ¥ (y)dxdy 


(7.608) 


où: 


D = 



7) e IR + x M + | 



(7.609) 


où les valeurs positives imposées proviennent à l'origine d'une loi du Khi-deux pour x et y. 
A in si: 


— V 

-hD m 


P CO = JJ Sx ( *) -fy M dxd Y = J Jy (7) J fx{x) dxd Y 


(7.610) 


Nous obtenons la fonction de densité de T en dérivant F. D'abord la dérivée intérieure: 


Ut ' 


f(t)=P'(t)=—\f ¥ (y)f x —y ydy (7.611) 
mi \m J 


Ensuite en explicitant puisque: 

1 


f(y) = 


2 xfA T(m/2) 


e yl2 y 2 et y 


(ni ' 

_ V 

1 ni 

1 

f-vl : 

y 

\m ) 

2 x,2 r(n/2) 1 

[m j 


(7.612) 


nous avons alors: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


430/4839 















Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


+CÙ H 

f(t) = — f_î_ 

7U m | 2* i2 T{ml2) 


M -i 

*-"V 


2 M/ 2 r(«/ 2 ) 


ydy 


2 B/ 2 r(«/ 2 ) 2 M/ 2 r(W 2 ) m 


j e~ )>/2 y 2 2m ' 




r _1 


Mi 

ymj 


;-i 


J 2 .yüfy 


M 

m 




2 B/ 2 r(«/ 2 ) 2 Ml2 T{mi2) 

n 
m 


Jfi j Bf M j 

| e -; " / 2 y 2 s 2 ™ y y 2 ydy 


m .. 


2(m+m)/2 j-i 


/ 


#3 J j-, /KH/K/ 


f7~V 2 ^ 

o 


(7.613) 


En faisant le changement de variable: 


« = ' 
2 




ni 


1 + — =>7 — u ■ 
K m) 


-, « 

1 +- t 


m J 


■ dy = du - 


fl 

1 + — £ 

^ m y 


(7.614) 


nous obtenons: 


/C0 = 


« 

A3 


+ M )/2 n 


m m 

\2) U/ 


ni y 

ym) 


2 2 


M M +M2 ) 


fl 


\ 


1 + - t 

\ W . 

fl 1 —| 

H+M _ 


B+ffl 

fl 1 3 -"° 


u 2 ^ Vü 


i™) 


v2J U, 


— l +—t 

.m) \ m } 


m 


a + m 


\ 


r 


M 

2 f-M 

\ n \ 

— 

1 

1 +- t 

\m) 

\ 

, m V 


M+M 

~2~ 


(7.615) 


/ 


fl + A3 
V 2 / 


/ M V 




:-l 




m 
2 / 


, « 

1 + — i 

^ «y 


\— 


^ / 


□C.Q.F.D. 


5.21. FONCTION DE BENFORD 


Cette distribution aurait été découverte une première fois en 1881 par Simon Newcomb, un astronome 
américain, après qu'il se fut aperçu de l'usure (et donc de l'utilisation) préférentielle des premières pages 
des tables de logarithmes (alors compilées dans des ouvrages). Frank Benford, aux alentours de 1938, 
remarqua à son tour cette usure inégale, crut être le premier à formuler cette loi qui porte indûment son 
nom aujourd'hui et arriva aux mêmes résultats après avoir répertorié des dizaines de milliers de données 
(longueurs de fleuves, cours de la bourse, etc.). 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


431/4839 




















































Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

Seule explication possible: nous avons plus souvent besoin d'extraire le logarithme de chiffres 
commençant par 1 que de chiffres commençant par 9, ce qui implique que les premiers sont "plus 
nombreux" que les seconds. 

Bien que cette idée lui paraisse tout à fait invraisemblable, Benford entreprend de vérifier son 
hypothèse. Rien de plus simple: il se procure des tables de valeurs numériques, et calcule le 
pourcentage d'apparition du chiffre le plus à gauche (première décimale). Les résultats qu'il obtient 
confirment son intuition: 


Chiffre initial 

Probabilité d'apparition 

1 

30.1 % 

2 

17.6 % 

3 

12.5 % 

4 

9.7 % 

5 

7.9 % 

6 

6.7 % 

7 

5.8 % 

8 

5.1 % 

9 

4.6 % 


Tableau: 7.10 - Probabilité d'apparition d'un chiffre selon la loi de Benford 


A partir de ces données, Benford trouve expérimentalement que la probabilité cumulée qu'un nombre 
commence par le chiffre n (excepté 0) est (nous allons le démontrer plus loin) donnée par la relation: 


P(n) =log ]0 



(7.616) 


appelée "fonction de Benford" (ou "loi de Benford"). 


Voici un tracé de la fonction précédente: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


432/4839 





























Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 



Figure: 7.33 - Tracé de la fonction de Benford (fonction de répartition) 

Il convient de préciser que cette loi ne s'applique qu'à des listes de valeurs "naturelles", c'est-à-dire à 
des chiffres ayant une signification physique. Elle ne fonctionne évidemment pas sur une liste de 
chiffres tirés au hasard. 

La loi de Benford a été testée sur toutes sortes de tables: longueur des fleuves du globe, superficie des 
pays, résultat des élections, liste des prix de l'épicerie du coin... Elle se vérifie presque à tous les coups. 

Elle est évidemment indépendante de l'unité choisie. Si l'on prend par exemple la liste des prix d'un 
supermarché, elle fonctionne aussi bien avec les valeurs exprimées en Francs qu'avec les mêmes prix 
convertis en Euros. 

Cet étrange phénomène est resté peu étudié et inexpliqué jusqu'à une époque assez récente. Puis une 
démonstration générale en a été donnée en 1996, qui fait appel au théorème de la limite centrale. 

Aussi surprenant que cela puisse paraître, cette loi a trouvé une application: le fisc l'utilise aux 
Etats-Unis pour détecter les fausses déclarations. Le principe est basé sur la restriction vue plus haut: la 
loi de Benford ne s'applique que sur des valeurs ayant une signification physique. 

S'il existe une distribution de probabilité universelle P(n) sur de tels nombres, ils doivent être invariants 
sous un changement d'échelle tel que: 


P(kn) =f{k)P{n) (7.617) 


Si: 


J\P(w)ü6î 


= 1 


(7.618) 


alors: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


433/4839 
























Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


jP(kn)dn = 1 ik (7.619) 


et la normalisation de la distribution donne: 


f(k) = \ik (7.620) 


si nous dérivons P(bi) = f (k)P(n) par rapport à fc nous obtenons: 




dk k 



en posant k = 1 nous avons: 


nP \n ) = -Pin) (7.622) 


Cette équation différentielle a pour solution: 


P{n)=\in (7.623) 


Cette fonction, n'est pas en premier lieu à proprement parler une fonction de distribution de probabilité 
(elle diverge) et deuxièmement, les lois de la physique et humaines imposent des limites. 

Nous devons donc comparer cette distribution par rapport à une référence arbitraire. Ainsi, si le nombre 
décimal étudié contient plusieurs puissance de 10 (10 au total: 0,1,2,3,4,5,6,7,9) la probabilité que le 
premier chiffre non nul (décimal) soit D est donnée par la distribution logarithmique: 



| P(n)dn 


(7.624) 


Les bornes de l'intégrale sont de 1 à 10 puisque la valeur nulle est interdite. 


L'intégrale du dénominateur donne: 


10 10 


HJ 1U 

| P{n)dn = = ln(l 0) - ln(l) = ln(l 0) (7.625) 


L'intégrale du numérateur donne: 



Ce qui nous donne finalement: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 









Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 



(7.627) 


ln(10) 


ln(10) 


De par les propriétés des logarithmes (voir le chapitre d'Analyse fonctionnelle) nous avons: 




V 


(7.628) 


Cependant, la loi de Benford ne s'applique pas uniquement aux données invariantes par changement 
d’échelle mais également à des nombres provenant de sources quelconques. Expliquer ce cas implique 
une investigation plus rigoureuse en utilisant le théorème de la limite centrale. Cette démonstration a 
été effectuée seulement en 1996 par T. Hill par une approche utilisant la distribution des distributions. 


Pour résumer un partie importante de tout ce que nous avons vu jusqu'ici, l'illustration ci-dessous est 
très utile car elle résume les relations 76 distributions univariées (57 continues et 19 discrètes): 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


435/4839 










Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


zipK*. fl) 

Un 


a = J 

■h = n 

Rtcl tr ^ ] 


rk:ld.-Liliü^jiifc]{il | | F nJ 


Netf-kilve t^p*»^ùrae4iic(n.i, m, fij) 



a, V 

-^ 

V 




--- 



Figure: 7.34 - Relations entre distributions (Source: AMS Lawrence M. Leemis and Jacquelyn T. McQueston) 


6 . ESTIMATEURS DE VRAISEMBLANCE 


Ce qui va suivre est d'une extrême importance en statistiques et est utilisé énormément en pratique. Il 
convient donc d'y accorder une attention toute particulière! Outre le fait que nous utiliserons cette 
technique dans la présent chapitre, nous la retrouverons dans le chapitre de Méthodes Numériques pour 
les techniques avancées de régressions linéaires généralisées ainsi que dans le chapitre de Génie 
Industriel dans le cadre de l'estimation des paramètres de fiabilité. 

Nous supposons que nous disposons d'observations x lr x 2 ,x 3 ,. ,.x x qui sont des réalisations de variables 
aléatoires non biaisées (dans le sens qu'elles sont choisies aléatoirement parmi un lot) indépendantes 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


436/4839 




















































































































































































































Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

X l ,X 2 ,X- i ,..X x de loi de probabilité inco nn ue mais identique. 

Nous allons chercher à estimer cette loi de probabilité P inconnue à partir des observations 

X 1 ,X 2 ,X^,...X x . 

Supposons que nous procédons par tâtonnements pour estimer la loi de probabilité P inconnue. Une 
manière de procéder est de se demander si les observations x l7 x 2 ,x 3 ,...x x avaient une probabilité 

élevée ou non de sortir avec cette loi de probabilité arbitraire P. 

Nous devons pour cela calculer la probabilité conjointe qu'avaient les observations x 1 ,x 2 ,x- i ,...x x de 
sortir avec p l ,p 2 ,p- i ,.. p K ■ Cette probabilité vaut (cf. chapitre de Probabilités): 

(7 - 629) 

z-l 

en notant P la loi de probabilité supposée associée à p l ,p 2 ,p z ,...p ll II faut avouer qu'il serait alors 

particulièrement maladroit de choisir une loi de probabilité (avec ses paramètres!) qui minimise cette 
quantité... 

H 

Au contraire, nous allons chercher la probabilité p l ,p 2 ,p 3 ,...p x qui maximise [ P{X ■ = x i ), c'est- 

z-1 

à-dire qui rende les observations x 1 ,x 2 ,x- i ,...x x le plus vraisemblable possible. 

Nous sommes donc amenés à chercher le (ou les) paramètre(s) Q qui maximise(nt) la quantité: 

4(a)-f]p,(4 < 7 «°) 

z-l 

Cette quantité L porte le nom de "vraisemblance". C'est une fonction du ou des paramètres $ et des 
observations Xj , x 2 , ,... x x . 

La ou les valeurs du paramètre $ qui maximisent la vraisemblance L* (&'j sont appelées "estimateurs 
du maximum de vraisemblance" (estimateur MV). 

Faisons quand même trois petits exemples (très classiques, utiles et importants dans l'industrie) avec 
dans l'ordre d'importance (donc pas forcément dans l'ordre de facilité...) la fonction de distribution de 
Gauss-Laplace (Normale), la fonction de distribution de Poisson et finalement Binomiale (et in extenso 
Géométrique). 


Remarque : Ces trois exemples sont importants car utilisés dans les SPC (maîtrise statistiques de 
processus) dans différentes multinationales à travers le monde (cf. chapitre de Génie Industrie ). 

6.1. ESTIMATEURS DE LA LOI NORMALE 

Soit x 1 ,x 2 ,x l ,...x x un «-échantillon de variables aléatoires identiquement distribuées supposées suivre 
une loi de Gauss-Laplace (loi Normale) de paramètres A et es 2 • 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


437/4839 








Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

Nous recherchons quelles sont les valeurs des estimateurs du maximum de vraisemblance 9 qui 
maximisent la vraisemblance L* [9) de la loi Normale? 


Remarque : Il va de soi que les estimateurs du maximum de vraisemblance 9 sont ici: 

9 = [/j,o 2 ) (7.631) 


Nous avons démontré plus haut que la densité d'une variable aléatoire gaussienne était donnée par: 

h (x-R) 1 

P(x,ft,à) = - = e~ 2 - 7 * 

ctv 2 n 


La vraisemblance est alors donnée par: 


1 A 2 

« i 

L\ fÂ, a 2 i = x i ,pi,cr\ =- —e Z<J !=1 

cf 2 


(7.633) 


2=1 


Maximiser une fonction ou maximiser son logarithme est équivalent donc la "log-vraisemblance" sera: 

2 


ln [Zl fi, a 2 )] = -^ln(2?r) - »ln(cr) " *ï “ ^ 


(7.634) 


Pour déterminer les deux estimateurs de la loi Normale, fixons d'abord l'écart-type. Pour cela, dérivons 
ln ^Zi o 2 ij par rapport à f* et regardons pour quelle valeur de la moyenne la fonction s'annule. 

Il nous reste après simplification le terme suivant qui est égal à zéro: 

H 

y 1 ; ~ U i (7.635) 

2-1 

Ainsi, l'estimateur du maximum de vraisemblance de la moyenne (espérance) de la loi Normale est 
donc après réarrangement: 


1 B 
« tl 


(7.636) 


et nous voyons qu'il s'agit simplement de la moyenne arithmétique (ou appelée aussi "moyenne 
empirique"). 

Fixons maintenant la moyenne. L'annulation de la dérivée de ln ^Zi pi, a 2 ij en q 2 conduit à: 

in [zf fx, a 2 )] = - - + i x i ~ V |2 = 0 ( 7 - 637 ) 

dcr L ' J cr cr 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


438/4839 












Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

Ce qui nous permet d'écrire l'estimateur du maximum de vraisemblance pour l'écart-type (la variance 
lorsque la moyenne est connue selon la loi de distribution supposée elle aussi connue!): 

cr =-XU-/t] (7.638) 

n i'=l 

que certains appellent aussi "écart-type de Pearson"... 

Cependant, nous n'avons pas encore défini ce qu'était un bon estimateur ! Ce que nous entendons par 
là: 

- Si l'espérance d'un estimateur est égale à elle-même, nous disons que cet estimateur est "sans biais" et 
c'est bien évidemment ce que nous cherchons! 

- Si l'espérance d'un estimateur n'est pas égale à elle-même, nous disons alors que cet estimateur est 
"biaisé" et c'est forcément moins bien... 


Dans l'exemple précédent, la moyenne est donc non biaisée (trivial car la moyenne de la moyenne 
arithmétique est égale à elle-même). Mais qu'en est-il de la variance (in extenso de l'écart-type) ? 

Un petit calcul simple par linéarité de l'espérance (puisque les variables aléatoires sont identiquement 
distribuées) va nous donner la réponse dans le cas où la moyenne théorique est approchée comme dans 
la pratique (industrie) par l'estimateur de la moyenne (cas le plus fréquent). 


Nous avons donc le calcul de l'espérance de la "variance empirique": 


â 2 '=E'V[Xii= E 


1 J^ 


\» 1=1 


IJ!, 


“Z = E “Z 1 7 i ~ 2x i £ + £ 


\ n 1=1 


= E 


1 JL 


1 JL 


\ / 


-'Zï-ty-'Lxt+F =E 


V» 1=1 


1=1 


1 n 

1 ^ 2 o ^ 2 . -2 


V* i=l 


= B 


/ -I n ^ 


\» i=i 


(7.639) 


1 JL 


= -Z E\ 4 I- E\pf ' 


i=i 


Or, comme les variables sont équidistribuées: 


E\ô i 2 ' =-'ZE[x 2 )-Efê} = E[x 2 )- e{$ 2 } (7.640) 

n i=i 

Et nous avons (relation de Huyghens): 


V* X' = E\ X 1 \- E> X\ 2 (7-641) 


ainsi que: 


V> fi< = E* I -EXfi? =E'iï 2 1-5. X ? (7.642) 

où la deuxième relation ne peut s'écrire que parce que nous utilisons l'estimateur du maximum de 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


439/4839 
















Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

vraisemblance de la moyenne (moyenne empirique). D'où: 

B\ô 1 i =B\X 2 \-S\fi 2 \ = \V, X\+E[ X? )-\V[fi\ + E[ X? j = F, X)-Vifi) (7.643) 
et comme: 


, o 2 

ViX ^O 2 etVifil=— (7.644) 


Nous avons finalement: 


B\ô 1 j = a 2 


— = {1 - -1 O 2 = ^—La 2 (7.645) 

n ^ n) n 


nous avons donc un biais de moins une fois Terreur-standard: 


_ _ (7.646) 

n 

nous disons alors que cet estimateur à un biais négatif (il sous-estime la vraie valeur!). 

Nous noterons également que l'estimateur tend vers un estimateur sans biais (E.S.B.) lorsque le nombre 
d'individus tend vers l'infini n —> qo . Nous disons alors que nous avons un "estimateur 
asymptotiquement non biaisé" ou "estimateur asymptotiquement débiaisé". 

Il est important de prendre note que nous avons démontré que la variance empirique tend vers la 
variance théorique quand n tend vers l'infini et ce... que les données suivent une loi Normale ou non! 


Remarque : Un estimateur est aussi dit "estimateur consistant" s'il converge en probabilité, lorsque 
n —> oo s vers la vraie valeur du paramètre. 


De par les propriétés de l'espérance, nous avons alors: 

£(5(â^)) .fff— O 2 ) (7.647) 


il vient alors: 


= = J-Lzb-W 


(7.648) 


que certains appellent aussi "écart-type standard"... (à ne pas confondre avec "l'erreur-standard" que 
nous verrons plus loin). 

Nous avons donc finalementet pour résumer les deux résultats importants suivants: 

1. "L'estimateur du maximum de vraisemblance biaisé" ou appelé également "écart-type empirique" ou 
encore "écart-type échantillonnai" ou encore "écart-type de Pearson" ... et donc donné par: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


440/4839 

















Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


cr = 



-iï 


(7.649) 


lorsque n —> °° . Nous retrouvons cet écart-type suivant les contextes (par tradition) noté de quatre 
différentes façons qui sont: 


i (7.650) 


et même parfois (mais c'est très malheureux car cela génère alors souvent de la confusion) tr ou S. 

2. "L'estimateur du maximum de vraisemblance non biaisé" ou appelé également "écart-type standard": 


o = 



(7.651) 


Nous retrouvons cet écart-type suivant les contextes (par tradition) noté de quatre différentes façons 
qui sont: 


i (7.652) 

Nous retrouverons ces deux dernières souvent dans les tables et dans de nombreux logiciels et que nous 
utiliserons plus bas dans les développements des intervalles de confiance et des tests d'hypothèses! 

Par exemple, dans la version françaisde de Microsoft Excel 11.8346 l'estimateur biaisé est donné par la 
fonction ECARTYPEP( ) et le non biaisé par ECARTTYPE( ). 

Au total, cela nous fait donc trois estimateurs pour la même quantité! ! Comme dans l'écrasante majorité 
des cas de l'industrie la moyenne théorique n'est pas connue, nous utilisons le plus souvent les deux 
dernières relations encadrées ci-dessus. Maintenant, c'est là que c'est le plus vicieux: lorsque nous 
calculons le biais des deux estimateurs, le premier est biaisé, le second ne l'est pas. Donc nous aurions 
tendance à n'utiliser que le second. Que nenni! Car nous pourrions aussi parler de la variance et de la 
précision d'un estimateur, qui sont aussi des critères importants pour juger de la qualité d'un estimateur 
par rapport à un autre. Si nous faisions le calcul de la variance des deux estimateurs, alors le premier, 
qui est biaisé, a une variance plus petite que le second qui est sans biais! Tout ça pour dire que le critère 
du biais n'est pas (et de loin) le seul à étudier pour juger de la qualité d'un estimateur. 

Enfin, il est important de se rappeler que le facteur -1 du dénominateur de l'estimateur du maximum de 
vraisemblance non biaisé provient du fait qu'il fallait corriger l'espérance de l'estimateur biaisé à la base 
minoré de une fois l'erreur-standard! 

6.2. ESTIMATEURS DE LA LOI DE POISSON 


En utilisant la même méthode que pour la loi Normale (Gauss-Laplace), nous allons donc rechercher les 
estimateurs du maximum de vraisemblance de la loi de Poisson qui rappelons-le, est définie par: 

R = — e~ M (7-653) 

k\ 

Dès lors, la vraisemblance est donnée par: 

[Vincent ISOZ] | http://www.sciences.ch] | Page: 


441/4839 












Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


£CA) = fl^.rf = ^ 


S* 

■ 2-1 


( 7 . 654 ) 


n*' 


Maximi s er une fonction ou maximiser son logarithme est équivalent donc: 


ln [£(/0] = ln (/0£ ^ _ 2 ln ( x i ! ) _ (7 - 655) 


Nous cherchons maintenant à la maximiser: 



et obtenons donc son unique estimateur du maximum de vraisemblance qui sera: 


U=-YJh ( 7 - 657 ) 

« ,=1 


Il est tout à fait normal de retrouver dans cet exemple didactique la moyenne empirique, car c'est le 
meilleur estimateur possible pour le paramètre de la loi de Poisson (qui représente aussi l'espérance 
d'une loi de Poisson). 


Sachant que l'écart-type de la distribution particulière (voir plus haut) n'est que la racine carrée de la 
moyenne, nous avons alors pour l'écart-type du maximum de vraisemblance biaisé: 



(7 - 658) 


Remarque : Nous montrons de la même manière des résultats identiques pour la loi exponentielle 
très utilisée en maintenance préventive et fiabilité! 


6.3. ESTIMATEUR DE LA LOI BINOMIALE (ET GÉOMÉTRIQUE) 

En utilisant la même méthode que pour la loi Normale (Gauss-Laplace) et la loi de Poisson, nous allons 
donc rechercher l'estimateur du maximum de vraisemblance de la loi Binomiale qui rappelons-le, est 
définie par: 



Dès lors, la vraisemblance est donnée par: 



[Vincent ISOZ] | http://www.sciences.ch] | Page: 


















Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

Il convient de se rappeler que le facteur qui suit le terme combinatoire exprime déjà les variables 
successives selon ce que nous avons vu lors de notre étude de la fonction de distribution de Bernoulli et 
de la fonction binomiale. D'où la disparition du produit dans la dernière égalité précédente. 

Maximiser une fonction ou maximiser son logarithme est équivalent donc: 

ln[£C^)] = ln(cf , ) + iln(^) + (JV r -A:)ln(l- j p) (7.661) 


Nous cherchons maintenant à la maximi s er: 

ain [L(p)] = k_lf-k = 0 (7662) 

dp p 1 -p 

Le lecteur au remarque que le coefficient biniomial a disparu. Dès lors, nous en déduisons 
immédiatement que l'estimateur de la loi binomiale sera le même que celui de la loi géométrique. 

Ce qui donne: 

k{\ - p) - p{N- k) - k - kp -pN + pk - k- pN — 0 (7.663) 


d'où nous tirons l'estimateur du maximum de vraisemblance biaisé qui sera: 



(7.664) 


Ce résultat est assez intuitif si l'on considère l'exemple classique d'une pièce de monnaie qui a une 
chance sur deux de tomber sur une de ces faces. La probabilité p étant le nombre de fois k où une face 
donnée a été observée sur le nombre d'essais total (toutes faces confondues). 


Remarque : Dans la pratique, il n'est pas aussi simple d'appliquer ces estimateurs! Il faut bien 
réfléchir lesquels sont les plus adaptés à une expérience donnée et idéalement calculer également 
l'erreur quadratique moyenne (erreur-standard) de chacun des estimateurs de la moyenne (comme 
nous l'avons déjà fait pour la moyenne empirique plus tôt). Bref c'est un long travail de réflexion. 


6.4. ESTIMATEURS DE LA LOI DE WEIBULL 


Nous avons vu dans le chapitre de Génie Industriel une étude très détaillée de la loi de Weibull à trois 
paramètres avec son écart-type et son espérance car nous avions précisé qu'elle était assez utilisée dans 
le domaine de l'ingénierie de la fiabilité. 


Malheureusement les trois paramètres de cette loi nous sont en pratique inconnus. A l'aide des 
estimateurs nous pouvons cependant déterminer l'expression de deux des trois en supposant Y comme 
étant nul. Cela nous donne donc la loi de Weibull dite "loi de Weibull à deux paramètres" suivante: 



/ 

/AAJ®") 

P(x,A?) = - 

X 

exp 

— 

X 


V 

kVj 


V 

kVj 

J 


(7.665) 


avec pour rappel fi > 0 et 7} > 0 . 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


443/4839 




















Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


Dès lors la vraisemblance est donnée par: 


L(Av) = Y\PWWW) = f[- 

1=1 v \ j 


( \^ -1 ( f \j®") 


exp 


1=1 


jsX ( Af*.V'W*, v ' M 


5 

WJ 


(7.666) 


WJ 


exp 


mW 


n,,, 

2=1 WJ 


Maximiser une fonction ou maximiser son logarithme est équivalent donc: 


\n[L(J, V )] = \n 


'lT 


exp 


-Z 


3! / T \J®") 3! ,. \^ _1 

j-L ■ 


:=i 


WJ 


n 

]=1 




- w ln 


= ttln 


/ | h 


l 

WJ 

W J 


--7Z^+2> 

V 3=1 3=1 


/ T ^-1' 
-L 

•W j 


= «ln 


/ &\ | n 


WJ 


--VZ^+^-^Z 111 

V 3=1 3=1 


fi) 

kï J 


(7.667) 


-37 _jS S^ +(^-i)Z ln 

3=1 3=1 


H / "’i. 


U J 


Cherchons maintenant à maximiser cela en se rappelant que (cf. chapitre de Calcul Différentiel et 
Intégral): 

J J 

— a x - a x ln(ia) et — a~ x - -a x ln(ia) (7.668) 
dx dx 

d’où: 


n / r \ 


3/5 £ ?T 3=1 T 3=1 3=1 WJ 


1 1 " 
= + — 

P v' 


2^(ln(?)-ln(^)) 

3=1 

2*'(ln(*)-lnOP)) 


1 1 " 

= «—-—: 

£ ^ 3=1 

1 -ira / T \ n i 1 '' \ 

= «i-4-y i/ ln A +Yln ÜL 

P IjWl U J Ü U / 



{ r \ 

+2> 


_ 3=1 

W J 

n 

w > 

+2> 

Z 

_ 3=1 



(7.669) 


= 0 


Et nous avons pour le deuxième paramètre: 


91n[£(A?)] 1 j3 " 


drj 




*2^xf +(1- fi)n— = 0 (7.670) 


V ?A #=i 


d'où: 


A Z xf-n = 0 (7-671) 

3=1 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


444/4839 





























































Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


Finalement avec les écritures correctes (et dans l'ordre de résolution dans la pratique): 


1 1 




/ „ \ 


1 


4 +2> 4 =0et —= o <7 072) 

fi 7) ^ 2—1 V J 1=1 \V } 7}^ 2=1 

La résolution de ces équations implique de lourds calculs et on ne peut rien en tirer dans les tableaux 
classiques comme Microsoft Excel ou Cale de Open Office. 

On prend alors une approche différente en écrivant notre loi de Weibull à deux paramètres ainsi: 

(7.673) 


P(x,fi,8) = 1 exp 


x^ 




avec pour rappel fi > 0 et 8 > 0 • 

Dès lors la vraisemblance est donnée par: 

£(Aü) = flP(x t ,fî,0) = ex P 

2=1 2=1 & 


s\ 


X7 




'£ 

8 


" n n 


exp 


-Z^n^ 1 (2.674) 


i-1 9 Ji-l 


Maximiser une fonction ou maximiser son logarithme est équivalent donc: 

f ( n n 

— exp 

w 


ln[l(A0)] = ln 


-z^- n*r 

V i=l 6 J 2=1 


= «lnf— 

L0 




(7.675) 


Cherchons maintenant à maximiser cela en se rappelant que (cf. chapitre de Calcul Différentiel et 
Intégral): 


7 7 

— a x - a x ln(a) et — a~ x — —a' ln(a) (7.676) 
dx dx 


d'où: 


M*) + Î>M = » («77) 

O P P 8 !=1 !=1 


Et nous avons pour le deuxième paramètre: 


31n[Z(flg)] = _» + l j, xf=0 
38 8 


Il est alors immédiat que: 


8=-Txf‘ (7.679) 

«2=1 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


445/4839 


























Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

injecté dans la relation: 


Il vient: 


n 

1 


l|;^lnU.)+Zl“U)=0 

^ 1=1 3=1 


(7.680) 


n 

1 


Z „ 

-+Z>U) = o < 7 - 681 ) 

-Z4 - 1 

n i-\ 


en simplifiant: 


1=1 



3=1 


-i = -Z ln U) < 7 - 682 ) 

£ « ,-=l 


La résolution des deux équations (dans l'ordre de haut en bas): 



(7.683) 


peut très facilement être calculée avec l'outil Valeur Cible de Microsoft Excel ou Cale de Open Office. 
6.5. ESTIMATEURS DE LA LOI GAMMA 

Nous allons utiliser ici une technique appelée "méthode des moments" pour déterminer les estimateurs 
des paramètres de la loi Gamma. 

Supposons que X n sont des variables aléatoires indépendantes et identiquement distribuées selon 

la loi Gamma avec pour densité: 




r&0 


■] 0 , 4 ®[ 


(7.684) 


Nous cherchons à estimer a, A. Pour cela, nous déterminons d’abord quelques moments théoriques. 
Le premier moment est l’espérance qui comme nous l’avons démontré vaut: 


a 


B(X) = jrç = - (7.685) 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


446/4839 












Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

et le second moment, l'espérance du carré de la variable, est comme nous l'avons démontré 
implicitement lors de la démonstration de la variance de la loi Gamma: 

ir2 fl (fl +1) 

E\ i = wî2 = (7.686) 

À 2 

Nous exprimons ensuite la relation entre les paramètres et les moments théoriques: 


La résolution donne: 




m 2 


a 

1 

fl (fl +1) 

À 2 


(7.687) 


fl = 


m J 




i _ ^2 ~ 


(7.688) 


Une fois ce système établie, la méthode des moments consiste à utiliser les moments empiriques, en 
l'occurrence pour notre exemple les deux premiers, my, : 


— 


Xi + ...+X H 


Xt +...+Xi 


m 2 = 


(7.689) 


que l'on pose égaux aux moments théoriques vrais... Dès lors, il vient: 



(7.690) 


7. FACTEUR DE CORRECTION SUR POPULATION FINIE 


Maintenant démontrons un autre résultat qui nous sera indispensables dans certains tests statistiques 
que nous verrons plus loin. 

Supposons que nous avons une population de N individus que nous représentons par l'ensemble 
i 1,2 ,..,N\ et une variable aléatoire X qui est donc une application de ; 1, 2,..,N\ dans IR . Nous posons 
x i = X(ï). La moyenne de X est alors donnée par: 




— Vx- (7.691) 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


447/4839 
















Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

La variance de X est par définition: 

a 2 = — Tir- -i? i (7.692) 

Considérons à présent l'ensemble E des échantillons ■ ^.. ,i n ■ de taille n pris dans \ avec 

0 <n < N ■ Chaque individu a une probabilité d'être tiré égale à: 

11 1 ' N—n ' ! 

-...-=- (7.693) 

N N -1 N-\n-X\ N ! 

Nous nous intéressons à la variable aléatoire x définie sur E et étant égale à la moyenne de 
l'échantillon. Plus précisément: 


1 H 

X\ ij .. ,i n ' = — Tx,- (7.694) 
n k=\ 


Afin de calculer la variance V ■ X \, nous allons exprimer x comme somme de variables aléatoires. En 
effet si nous définissons les variables avec k = \...N par: 


X k (ïj . 


[x*. si£ e {î 1; ... ,i n } 
I 0 sinon 


(7.695) 


Nous avons naturellement (donc de la par la définition précédente): 


- 1 N 
1 


(7.696) 


et donc il vient: 


V' X ' = — 


k 


I + ' X i ,Xj I 

J 


(7.697) 


Les variables aléatoires X% ne sont pas indépendantes deux à deux, en effet comme nous allons le voir, 

leurs covariances ne sont pas nulles si N est fini. Dans le cas contraire, (covariance nulle), nous 
retrouvons un résultat déjà démontré plus haut: 

■7 0^ 

r.j?.=4 =— ( 7 - 698 > 

x n 


Il nous faut donc calculer les variances V ' X% ■ et les covariances cov i X,, Xj i. 

Pour ce faire nous allons utiliser la relation de Huyghens et pour cela nous allons commencer par 
calculer l'espérance E < X^ \ : 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


448/4839 











Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


P ■ X k ■ = P ■ X k = Xfc j ■ Xj. (7.699) 


Or P i X k - x k ' est la probabilité qu'un échantillon contienne k. Cette probabilité vaut bien 
évidemment n! N z t par suite: 


De la même façon nous obtenons 


EiX k i = — -x k (7.700) 
N 


E\Xl\=~xi (7.701) 

N 


Nous pouvons donc calculer la variance V ' X k ■ : 


N 


n V A r - n ' 2 


« 

J 


ir 


xi (7-702) 


Pour calculer les covariances avons à présent besoin de calculer les espérances E\ X i Xj \ : 

E i X^ ■ X, i = P i Xj = Xj, Xj = Xj i x i Xj (7.703) 

Or Pi X i = x,,P, = Xj i est la probabilité qu'un échantillon contienne i et j. Cette probabilité vaut bien 
évidemment: 


n n -1 


N N -1 


(7.704) 


et par suite: 


n> n - 11 

P' X- • X,- i = - ■ XjXj (7.705) 

3 7 ATi N— 1, ! J 


Nous pouvons à présent calculer les covariances: 


cov\ X ÿ ,X ; . i = Pi \Xi ■ Xj ! - El X } ■ i P' X,- J = 

«iP-fli 


n i m — li 


- ■ x- x,- - —— X,Xv 

AfiAf-li J AT 2 J 


(7.706) 






Nous sommes maintenant en mesure de calculer V \ X \ : 


V\X\ = 


TY<X k ■ +^CovX ! -,X ; 

v / 


« ■ iV— « i,_. 9 n'N-n 


N‘ 


"T—I Z 

■2 


. ^T 1 


Xi 




(7.707) 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


449/4839 




















Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

Sachant que (réarrangement de la définition de la variance): 

y \x 2 =N{a 1 +p?) (7.708) 

Et que (réarrangement de la définition de la moyenne): 

Yx, = Nf (7.709) 


Nous avons: 


Et donc: 


V\X\ = 


ïî'N-n ' n n N'N’-Kl „ 

-(o 2 + p?)- . Y.^-(A r j tf-x,-) 


V 


n i A' - - « i 
N 

n ' A/ - - n ' 


A/ - 


CT 2 + pP" I — 


A/' 2 ' N -1 


N 2 i AA — 1. T 


■N 2 pi 2 + ■ 


Af^ ■ Af -1 ■ “ 




(7.710) 


9 'J «'A/"-«l n «'A r -«l 9 'J 

cr + pi 2 i--/r +- (cr +pr) 

N {N- li AT. AT-IJ , 


= ...=o 2 


A/-h) 
n i A/ - -11 


æf, = ^.JEEï 

* jliir -1 


(7.711) 


Le terme: 




A/-* 

A/-1 


<1 


(7.712) 


que nous avons déjà rencontré lors de notre étude la loi hypergéométrique, et appelé "facteur de 
correction sur population finie" et il a pour effet de réduire Terreur-standard d’autant plus que n est 
grand. 

8 . INTERVALLES DE CONFIANCE 


Jusqu'à maintenant nous avons toujours déterminé les différents estimateurs de vraisemblance ou 
estimateurs simples (variance, écart-type) à partir de lois (fonctions) statistiques théoriques ou 
mesurées sur toute une population de données. 

Définition: Un "intervalle de confiance" est un couple de nombres qui définit une plage de valeurs 
possibles avec une certaine probabilité pour un estimateur statistique donné (plage calculée à l'aide de 
paramètres vrais mesurés). Il s'agit du cas le plus fréquent en statistiques. 

Nous allons maintenant aborder une approche un peu différente et importante dans l'industrie en se 
demandant maintenant quelles doivent être les tailles d'échantillons pour avoir une certaine validité 
(intervalle de confiance I.C.) pour les données mesurées ou encore quel écart-type ou fractile dans une 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


450/4839 




























Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

loi Normale centrée réduite (grand nombre d'individus), du Khi-deux, de Student ou de Fisher 
correspond à un certain intervalle de confiance (nous verrons ces deux derniers cas de faibles 
échantillons dans la partie traitant de l'analyse de la variance ou AN O VA) lorsque la variance ou la 
moyenne est connue ou respectivement inco nn ue sur l'ensemble ou une partie de la population donnée. 

Indiquons que ces intervalles de confiance utilisent le théorème central limite démontré plus loin (afin 
d'éviter toute frustration) et que les développements que nous allons faire maintenant nous seront 
également utiles dans le domaine des Tests d'Hypothèses qui ont une place majeure en statistique! 

Enfin, indiquons que de très nombreuses organisations (privées ou étatiques) font des statistiques 
fausses car les hypothèses et conditions d'utilisation ne sont pas rigoureusement vérifiées ou simplement 
omises ou pire encore, toute la base (les mesures) ne sont pas collectées dans les règles de l'art 
(fiabilisation de la collecte de données). 


Remarque : Le praticien doit être très prudent quant à au calcul des intervalles de confiance et à 
l'utilisation des tests d'hypothèses dans la pratique. Raison pour laquelle, afin d'éviter toute erreur 
triviale d'utilisation ou d'interprétation, il est important de se référer aux normes suivantes par 
exemple: ISO 2602:1980 (Interprétation statistique de résultats d'essais - Estimation de la moyenne 
- Intervalle de confiance), ISO 2854:1976 (Interprétation statistique des données - Techniques 
d'estimation et tests portant sur des moyennes et des variances), ISO 3301:1975 (Interprétation 
statistique des données - Comparaison de deux moyennes dans le cas d'observations appariées), ISO 
3494:1976 (Interprétation statistique des do nn ées — Efficacité des tests portant sur des moyennes et 
des variances), ISO 5479:1997 (Interprétation statistique des données - Tests pour les écarts à la 
distribution normale), ISO 10725:2000 + ISO 11648-1:2003 + ISO 11648-2:2001 (Plans et 
procédures d'échantillonnage pour acceptation pour le contrôle de matériaux en vrac), ISO 
11453:1996 (Interprétation statistique des données - Tests et intervalles de confiance portant sur les 
proportions), ISO 16269-4:2010 (Interprétation statistique des données Détection et traitement des 
valeurs aberrantes), ISO 16269-6:2005 (Interprétation statistique des données - Détermination des 
intervalles statistiques de tolérance), ISO 16269-8:2004 (Interprétation statistique des données - 
Détermination des intervalles de prédiction), ISO/TR 18532:2009 (Lignes directrices pour 
l'application des méthodes statistiques à la qualité et à la normalisation industrielle). 


8.1.1.C. SUR LA MOYENNE AVEC VARIANCE THÉORIQUE CONNUE 

Commençons par le cas le plus simple et le plus courant qui est la détermination du nombre d'individus 
pour avoir une certaine confiance dans la moyenne des mesures effectuées d'une variable aléatoire 
supposée suivre une loi Normale. 

D'abord rappelons que nous avons démontré au début de ce chapitre que l'erreur-type (écart-type à la 
moyenne) était sous l'hypothèses de variables indépendantes et indentiquement distribuées: 

(7.713) 

Maintenant, avant d'aller plus loin, considérons X comme une variable aléatoire suivant une loi 
Normale de moyenne A et d'écart-type a . Nous souhaiterions que la variable aléatoire ait par exemple 
95% de probabilité cumulée de se trouver dans un intervalle symétrique borné donné. Ce qui s'exprime 
donc sous la forme suivante: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


451/4839 











Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

P{fÂ-ô<X <fl + ô) = 0.95 (7.714) 


Remarque : Donc avec un intervalle de confiance de 95% vous aurez raison 19 fois sur 20, ou 
n'importe quel autre niveau de confiance ou niveau de risque a (1-niveau de confiance, soit 5%) 

que vous vous serez fixé à l'avance. En moyenne, vos conclusions seront donc bonnes, mais nous ne 
pourrons jamais savoir si une décision particulière est bonne! Si le niveau de risque est très faible 
mais que l'événement a quand même lieu, les spécialistes parlent alors de "grande déviation" ou de 
"black swan" (cygne noir). La gestion des valeurs aberrantes est traitée dans la norme 
ISO 16269-4:2010 Détection et traitement des valeurs aberrantes que tout ingénieur faisant des 
statistiques en entreprise se doit de respecter. 


En centrant et réduisant la variable aléatoire: 

( ô X-u ô\ 

P\-—< -— <— = 0.95 (7.715) 

\ ct CT a) 

Notons maintenant 71a variable centrée réduite: 


5 > 


f J v tfYï 

-—< Y 

+ 

1 -P\ Y>- 

O- J 


K \ &)} 


= 0.95 (7.716) 


Puisque la loi Normale centrée réduite est symétrique: 

S' 


1- 2P\Y>— I = 0.95 (7. 


D'où: 


S\ 

Y > — = 0.025 (7.718) 

o-J 


A partir de là en lisant dans les tables numériques de la loi Normale centrée réduite, nous avons pour 
satisfaire cette égalité que: 

■T 

— = 1.96 (7.719) 

CT 

Ce qui s'obtient facilement avec la version anglaise de Microsoft Excel 11.8346 en utilisant la fonction: 
-N ORMSIN V(( l-0.95)/2). 


Donc: 


ô = 1.96CT (7.720) 

Ce qui est noté de façon traditionnelle dans le cas général autre que 95% par (Z étant la variable 
aléatoire correspond donc à la loi Normale centrée réduite): 

ô = Za (7.721) 

[Vincent ISOZ] | http://www.sciences.ch] | Page: 


452/4839 
















Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

Or, considérons que la variable X sur laquelle nous souhaitons faire de l'inférence statistique est 
justement la moyenne (et nous démontrerons plus loin que celle-ci suit une loi Normale centrée 
réduite). Dès lors: 





( 7 . 722 ) 


nous en tirons: 


zV 


n = 


( 7 . 723 ) 


dont nous prenons évidemment (normalement...) la valeur entière supérieure... 


Cette dernière notation est plus souvent écrite sous la forme suivante mettant mieux en évidence la 
largeur de l'intervalle de confiance à un niveau a sous-jacent: 



( 7 . 724 ) 


Relation appelée "effectif de l'échantillon pour estimation par loi Normale". 

Ainsi, nous pouvons maintenant savoir le nombre d'individus à avoir pour s'assurer un intervalle de 
précision Q (marge d'erreur) autour de la moyenne et pour qu'un pourcentage donné des mesures se 
trouvent dans cet intervalle et en supposant l'écart-type théorique tr connu (ou imposé) d'avance 
(typiquement utilisé dans l'ingénierie de la qualité ou les instituts de sondages). 

Autrement dit, nous pouvons calculer le nombre n d'individus à mesurer pour s'assurer un intervalle de 
confiance donné (associé à Z) de la moyenne mesurée en supposant l'écart-type théorique connu (ou 
imposé) et en souhaitant un précision de S en valeur absolue sur la moyenne. 

Cependant... en réalité, la variable Z provient du théorème central limite (voir plus bas) qui donne pour 
un échantillon de grande taille (approximativement): 


X-p 
c i «Jn 


( 7 . 725 ) 


En réarrangeant nous obtenons: 


et comme Z peut être négatif ou positif alors 

/* = 


X-Z — ( 7 . 726 ) 

■>/« 

il est plus censé d'écrire cela sous la forme: 
X±Z-^= ( 7 . 727 ) 


Soit: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


453/4839 














Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

X-Z -^=<fii<X + Z-^= ( 7 . 728 ) 
yjn 


que les ingénieurs notent parfois: 


LCL <fI<UCL ( 7 . 729 ) 


avec LCL étant la lower confidence limit et UCL la upper confidence limit. C'est de la terminologie Six 
Sigma (cf. chapitre de Génie Industrie ). 

Et nous venons de voir plus avant que pour avoir un intervalle de confiance à 95% nous devrions avoir 
Z=1.96. Et puisque la loi Normale est symétrique: 

95% = 1- 5% = 1- a = 1- 2- 2.5% = 1- 2 ■ 0.025 ( 7 . 730 ) 


Cela se note finalement: 


X-Z 


ai 2 


-^=<f2<X+Z 


ai 2 



( 7 . 731 ) 


Comme nous l'avons déjà mentionné, et nous le démontrerons un peu plus loin, la moyenne 
arithmétique centrée réduite d'une séries de variables aléatoires indépendantes et identiquement 
distribuées de variance fini suit asymptotiquement une loi Normale centrée réduite, alors l'intervalle de 
confiance ci-dessus a une portée très générale! Raison pour laquelle nous parlons parfois de 
"d'intervalle de confiance asymptotique de la moyenne". 

Ces intervalles ont évidemment pour origine que nous travaillons très souvent en statistiques sur des 
échantillons et non sur toute la population disponible. L'échantillonage choisi influe donc sur 
l'estimateur ponctuel. Nous parlons alors de "fluctuation d'échantillonage". 

Dans le cas particulier d'un I.C. (intervalle de confiance) à 95%, la dernière relation s'écrit: 

~ ^0025 — 7 = — ^ ~ ^ 0.025 — F ( 7 . 732 ) 

Parfois nous retrouvons l'inégalité antéprécédente sous la forme équivalente suivante: 

X-Za!2V]t^VxïX+Zal2Vx ( 7 - 733 ) 

ou encore plus rarement sous la forme générale suivante (que l'on retrouve pour toutes les intervalles): 


X-ME<{A <X+ME ( 7 . 734 ) 


où ME signifie "marge d'erreur". 

Nous sommes ainsi capables maintenant d'estimer des tailles de population nécessaires à obtenir un 
certain niveau de confiance a dans un résultat, soit d'estimer dans quel intervalle de confiance se 

trouve la moyenne théorique en connaissant la moyenne expérimentale (empirique) et l'estimateur du 
maximum de vraisemblance de l'écart-type. Nous pouvons bien évidemment dès lors aussi déterminer la 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


454/4839 







Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

probabilité avec laquelle la moyenne est en dehors d'un certain intervalle... (l'un comme l'autre étant 
beaucoup utilisés dans l'industrie). 

Enfin, signalons que du résultat précédent, nous déduisons immédiatement par la propriété de stabilité 
de la loi Normale (démontrée plus haut) le test suivant que nous retrouvons dans de très nombreux 
logiciels de statistiques: 


fljfc. _ (^2 ~^l)~ C^2 ~/h) 

(7 ' 735) 

¥ «1 «2 


appelé "test Z bilatéral sur la différence de deux moyennes" avec l'intervalle de confiance 
correspondant: 


(x 2 <(x 2 -X,) + Z al2 Mxl P-736) 

^2 U 33 




Remarque : La taille de la population mère pour les relations développées plus haut n'entre pas en 
ligne de compte dans le calcul des intervalles de confiance ni dans celui de la taille de l'échantillon, 
et pour cause, elle est considérée infinie. Il faut donc faire attention à ne pas avoir parfois des tailles 
d'échantillons qui sont plus grandes que la population mère réelle possible... 

8.2,1.C, SUR LA VARIANCE AVEC MOYENNE THÉORIQUE CONNUE 

Commençons par démontrer une propriété fondamentale de la loi du Khi-deux: 

Si une variable aléatoire X suit une loi Normale centrée réduite X - 3/(0,1) alors son carré suit une loi 

du Khi-deux de degré de liberté 1 : 


X 2 = J 2 (1) (7.737) 


Démonstration: 

Pour démontrer cette propriété, il suffit de calculer la densité de la variable aléatoire x 2 avec 
X = 3/(0,1). Or, si X = 3/(0,1) et si nous posons y - X 2 ’ a l° rs pour tout y > 0 nous obtenons: 

P{Y<y) = p(x 2 <y)=P(-fi <X < +fi) (7.738) 

Puisque la loi Normale centrée réduite est symétrique par rapport à 0 pour la variable aléatoire X, nous 
pouvons écrire: 


P(Y<y) = 2P(o<X<fi) (7.739) 

En notant O la fonction de répartition de la loi Normale centrée réduite (sa probabilité cumulée en 
d'autres termes pour rappel...), nous avons: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


455/4839 













Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


(7.740) 


et comme: 


<ï>(0) = P{ 0 


1 * 

.0.0 = -!— J 

V2JT. 


e~ kl2 dk = 0.5 (7.741) 


alors: 

P(Y <y) = 2$(^)-20.5=2<ï>(^)-l (7.742) 

La fonction de répartition de la variable aléatoire (probabilité cumulée) y = X 2 est donc donnée par: 

P{Y <y) = 2$ (^)-i (7.743) 

si y est supérieur ou égal à zéro, nulle si y inférieur à zéro. Nous noterons cette répartition f Y (y) pour 
la suite des calculs. 

Puisque la fonction de distribution est la dérivée de la fonction de répartition et que X suit une loi 
Normale centrée réduite alors nous avons pour la variable aléatoire X: 


P(X = x) = »'(*) = iUo) = -3=.- 

dx yf27T 


P/2 


(7.744) 


et il s'ensuite pour la loi de distribution de Y (qui est donc le carré de X pour rappel!): 




d 


d 


d 


dy 


dy' ' ' ' dy ^ 1 ' ; dy 




J_ = 1 


(7.745) 


V2zr ^jÿ 7 2;T >' 


cette dernière expression correspond exactement à la relation que nous avions obtenue lors de notre 
étude de la loi du Khi-deux en imposant un degré de liberté unité. 

Le théorème est donc bien démontré, à savoir que si X suit une loi Normale centrée réduite alors son 
carré suit une loi du Khi-deux à 1 degré de liberté tel que: 


(^( 0 , 1 ) ) - Y 2 ( 1 ) 


(7.746) 


□C.Q.F.D. 

Ce type de relation est utilisé dans les processus industriels et leur contrôle (cf. chapitre de Génie 
Industriel). 

Nous allons maintenant utiliser un résultat démontré lors de notre étude de la loi Gamma. Nous avons 
effectivement vu plus haut que la somme de deux variables aléatoires suivant une loi Gamma suit aussi 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


456/4839 













Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

une loi Gamma dont les paramètres s'additionnent: 

X + Y= y{p+q,À) (7.747) 

Comme la loi du Khi-deux n'est qu'un cas particulier de la loi Gamma, le même résultat s'applique. 
Pour être plus précis, cela revient à écrire: 

Si X l ,...,X k sont des variables aléatoires indépendantes (!) et identiquement distribuées tV( 0,1) alors 
par extension de la démonstration précédente où nous avons montré que: 

(* W u )) 2 = r ! ( i ) <7 - 748 > 


et de la propriété d'addition de la loi Gamma, la somme de leurs carrés suit alors une loi du Khi-deux de 
degré k telle que: 


I 2 {k) = x 2 +x 2 +...+x 2 


(7.749) 


Ainsi, la loi du à k degrés de liberté est la loi de probabilité de la somme des carrés de k variables 

normales centrées réduites linéairement indépendantes entre elles. Il s'agit de la propriété de linéarité de 
la loi du Khi-deux (implicitement de la linéarité de la loi Gamma)! 


Maintenant voyons une autre propriété importante de la loi du Khi-deux: Si X 1 X n sont des 
variables aléatoires indépendantes et identiquement distribuées N(jâ, a 2 ) (donc de même moyenne et 

même écart-type et suivant une loi Normale) et si nous notons l'estimateur du maximum de 
vraisemblance de la variance: 



(7.750) 


alors, le rapport de la variable aléatoire S 2 sur l'écart-type supposé connu de l'ensemble de la 

population (dit "écart-type vrai" ou "écart-type théorique" pour bien différencier!) multiplié par le 
nombre d'individus n de la population suit une loi du Khi-deux de degré n telle que: 


I 2 (*)= il 


«S * 2 

~1F 


(7.751) 


Ce résultat est appelé "théorème de Cochran" ou encore "théorème de Fisher-Cochran" (dans le cas 
particulier d'échantillons gaussiens) et nous donne donc une distribution pour les écarts-types 
empiriques (dont la loi parente est une loi Normale). 

En utilisant la valeur de l'écart-type démontrée lors de note étude da la loi du khi-deux nous avons 
donc: 


V 


r nSl > 




= F l X (fl) J = 


(7.752) 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


457/4839 













Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

Mais n et a sont imposés et sont donc considérés comme des constantes. Il vient alors: 

2 ? 

^—V\sl\ = V\x 2 {n)\ = 2n^V\S!\ = a 1 ,=o A - (7.753) 

cr A ,S * n 

Et dès lors nous avons une expression de l'écart-type de l'écart-type empirique si nous connaissons 
l'écart-type de la population: 





(7.754) 


Mais nous avons démontré lors de notre étude des estimateurs que: 


Dès lors il vient que: 



(7.756) 


Il en découle donc la relation parfois importante dans la pratique: 







n 


(7.757) 


Rappelons que la population parente est dite "infinie" si le tirage de l'échantillon avec remise ou encore 
si la taille N de la population est très supérieure à celle de n de l'échantillon 


Remarques : 

RI. En laboratoire, les X^X n peuvent être vues comme une classe d'individus d'un même 

produit étudié identiquement par différentes équipes de recherche avec des instruments de même 
précision (écart-type de mesure nul). 

R2. S 2 est la "variance interclasse" également appelée "variance expliquée". Donc elle donne la 
variance d'une mesure ayant eu lieu dans les différents laboratoires. 


Ce qui est intéressant c'est qu'à partir du calcul de la loi du Khi-deux en connaissant n et l'écart-type 
cr 2 il est possible d'estimer cette variance (écart-type) interclasse. 


Pour voir que cette dernière propriété est une généralisation élémentaire de la relation: 

J 2 («) = X 2 +X 2 +... +X 2 (7.758) 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


458/4839 

















Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

il suffit de constater que la variable aléatoire («■£*)/ a 2 est une somme de n carrés de MO, 1 ) 

indépendants les uns des autres. Effectivement, rappelons qu'une variable aléatoire centrée réduite 
(voir notre étude de la loi Normale) est donnée par: 

Y - (7.759) 

C 


Dès lors: 


a 2 


„ 1 H H / U" _ 

=Z 

cr n ,- =1 ,=i V, c 


(7.760) 


Or, puisque les variables aléatoires X l ,...,X n sont indépendantes et identiquement distribuées selon 
une loi Normale, alors les variables aléatoires: 


c 


^—— (7.761) 

C 


sont aussi indépendantes et identiquement distribuées mais selon une loi Normale centrée réduite. 
Puisque: 


«£ h 2 9 

-±-=Z 2 W (7-762) 

en réarrangeant nous obtenons: 

_2 »& 2 

CT = — - (7.763) 

J 2 («) 

Donc sur la population de mesures, l'écart-type vrai suit la relation donnée ci-dessus. Il est donc 
possible de faire de l'inférence statistique sur l'écart-type lorsque la moyenne théorique est connue (...). 

Puisque la fonction du Khi-deux n'est pas symétrique, la seule possibilité pour faire l'inférence c'est de 
faire appel au calcul numérique et nous noterons alors l'intervalle de confiance à 95% (par exemple...) 
de la manière suivante: 


ftS# 9 ?2jS>|e 

-< cr < - 

f2.5% ( K ) *97.5% ( n ) 


(7.764) 


Soit en notant 95% = 1- a'- 


2 

-< cr < - 

la S 2W 


(7.765) 


le dénominateur étant alors bien évidemment la probabilité cumulée. Cette relation est rarement utilisée 
dans la pratique car la moyenne théorique n'est pas connue. Voyons donc le cas le plus courant: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


459/4839 


















Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


8.3.1.C. SUR LA VARIANCE AVEC MOYENNE EMPIRIQUE 

Cherchons maintenant à faire de l'inférence statistique lorsque la moyenne théorique de la population 
A n'est pas connue. Pour cela, considérons maintenant la somme: 


2, (X. -f/Y 1 " 


1 ^ 


r(*) = Z ^ 

i=i a ) & i=i £> i=i 

où pour rappel X est la moyenne empirique (arithmétique) de l'échantillon: 


(7.766) 


X=-TX i (7.767) 

* i=l 


En continuant le développement nous avons: 

1 ~ ,s2 1 " 


a j=i a 2 =i 

Z - ^) 2 + 2 <Z- ^)Z - x) +Z a ) 2 


Z " 
Z 


1=1 

1 


o 2 


1=1 

n 


ï=1 


2 (JT, - xy + 2(X-m)X (X t - X) +*(X-fi)‘ 
1=1 1=1 

(7.768) 


Or, nous avons démontré au début de ce chapitre que la somme des écarts à la moyenne était nulle. 
Donc: 




2 ( x t - xy + 2 (x - m) ■ o +»(x - mÿ 

i=l 


Z " 

O 2 


^(Xt-XŸ+niX-vY 

i=i 


\2 H 


_^(X i -X) 2 n(X-v) 

^ a 2 ^ 


{Xt-Xf , ( X-fA^ 


1=1 


o 2 


■ + 


i=i 


o 2 yo 2 f 


(7.769) 


et reprenons l'estimateur sans biais de la loi Normale (nous changeons de notation pour respecter les 
traditions et bien différencier la moyenne empirique de la moyenne théorique): 

S 2 = Z—V (X t - X) 2 (7.770) 

*-li=l 

Dès lors: 




2=1 


o 2 


X-fA ^ 
o 2 f -Jn 


(*-i)£ 2 

^ r “ 


+ 


X-fA ^ 
o 2 />/«, 


(7.771) 


ou autrement écrit: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


460/4839 

































Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


I 2 («) 


(«- 1)£ 2 


+ 


o 2 f 


(7.772) 


Puisque le deuxième terme (au carré) suit une loi Normale centrée réduite aussi, alors si nous le 
supprimons nous obtenons de par la propriété démontrée plus haut de la loi du Khi-deux: 


I 2 (»-!) = 


( w -1),? 2 


CT 2 


(7.773) 


Ces développements nous permettent cette fois-ci de faire aussi de l'inférence sur la variance g 2 d'une 
loi N {pi, a) lorsque les paramètres A et a sont tous les deux inconnus pour l'ensemble de la 
population. C'est ce résultat qui nous donne, par exemple, l'intervalle de confiance: 

(«- 1)£ 2 2 (*- l )£ 2 

- -< er < —y--- (7.774) 

2or/2 0** “ 1) iï-a/2 ~ 1) 


lorsque la moyenne théorique A est donc inconnue. 


8.4,1.C. SUR LA MOYENNE AVEC VARIANCE EMPIRIQUE CONNUE 


Nous avons démontré beaucoup plus haut que la loi de Student provenait de la relation suivante: 


T(k) = 


Z 

■ftjïk 


(7.775) 


si Z et U sont des variables aléatoires indépendantes et si Z suit une loi Normale centrée réduite _/V(0,l) 
et U une loi du Khi-deux j 2 (>) tel que: 


4(0 = 


n +1 


r(»/2)-Æïr 


i+£- 

n 


Æ+l 

2 ^ 


(7.776) 


et rappelons que la fonction de densité (distribution) est symétrique! 

Voici une application très importante du résultat ci-dessus: 

Supposons que X 1 X n constituent un échantillon aléatoire de taille n issu de la loi N(u, a) . Alors 
nous pouvons déjà écrire que selon les développements faits plus haut: 


, X-fi 

Z = -P (7.777) 

Et pour U qui suit une loi j' 2 (k) , si nous posons k = n - 1 alors selon les résultats obtenus plus haut: 

U = = x 2 (» - 1) (7.778) 

cr 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


461/4839 

























Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

Nous avons alors après quelques simplifications triviales: 


X - X-jx_ 

Z_ _ _ ci %fn __ _ X_ ~ M 

-JüTk l(n-i)gî T J(»—îjsr 2 -Js* si-JH 

Donc puisque: 

Z 

T(k) = - (7.780) 

4ÜTk 

suit une loi de Student de paramètre k alors nous obtenons le "indépendant one-sample /-test" (en 
anglais) ou "test-Jà 1 échantillon": 




= T{n- 1) 


(7.781) 


quisuit aussi une loi de Student de paramètre n -1 et qui est très utilisé dans les laboratoires pour les tests 
d'étalonnages. 


Ce qui nous donne aussi après réarrangement: 


M=X-JLt(x-X) 


(7.782) 


Ce qui nous permet de faire de l'inférence sur la moyenne A d'une loi Normale d'écart-type théorique 
inconnu (sous-entendu qu'il n'y a pas assez de valeurs expérimentales) mais dont l'estimateur sans biais 
de l'écart-type est connu. C'est ce résultat qui nous donne l'intervalle de confiance: 



(« -1) < fi < X + ——T aj 2( n 1) 


(7.783) 


où nous retrouvons les mêmes indices que pour l'inférence statistique sur la moyenne (espérance) d'une 
variable aléatoire d'écart-type (théorique) connu puisque la loi de Student tend asymptotiquement pour 
de grandes valeurs de n vers une loi Normale. Ainsi, l'intervalle précédent et l'intervalle suivant: 


X ~ Z a /2-l=ÏVïX+Z a/ 2-?= (7.784) 

donneront des valeurs très proches (à la troisième décimale) pour des grandeurs de n aux alentours des 
ÎO'OOO (dans la pratique on considère qu'à partir de 100 c'est identique...). 

Nus déduisons immédiatement par la propriété de stabilité de la loi du Khi-deux (démontrée plus haut 
par le fait qu'elle découle de la loi Gamma) le test suivant que nous retrouvons dans de très nombreux 
logiciels de statistiques: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


462/4839 
























Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


iX 2 -X l \-T an {n-\) (7-785) 



appelé "test-T 1 bilatéral sur la différence de deux moyennes". 


Nous pouvons bien évidemment dès lors aussi déterminer la probabilité avec laquelle la moyenne est 


dedans ou en dehors d'un certain intervalle... (l'une comme l'autre étant beaucoup utilisées dans 
l'industrie). 

Le lecteur pourra s'amuser à contrôler avec la version française de Microsoft Excel 11.8346 que pour 
un grand nombre de mesures n, la loi de Student tend vers la loi Normale centrée réduite en comparant 
les valeurs des deux fonctions ci-dessous: 


=LOI.STUDENT.INVERSE.N(5%/2;«-l) 

LOI .NORM ALE. STAND ARD. INVERSE ,N(5 %/2) 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 









Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


Remarque : Le résultat précédent fut obtenu par William S. Gosset aux alentours de 1910. Gosset 
qui avait étudié la mathématique et la chimie, travaillait comme statisticien pour la brasserie 
Guinness en Angleterre. À l'époque, on savait que si Jfj X n sont des variables aléatoires 

indépendantes et identiquement distribuées alors: 


X-f* 
af -Jn 


0,1) (7.786) 


Toutefois, dans les applications statistiques on s'intéressait bien évidemment plutôt à la quantité: 


X-fJi 

Sl4n 


(7.787) 


on se contentait alors de supposer que cette quantité suivait à peu près une loi Normale centrée 
réduite ce qui n'était pas une mauvaise approximation comme le montre l'image ci-dessous ( 
df = n -1 ): 



Figure: 7.35 - Comparaison entre la fonction de distribution Normale et celle de Student 

Suite à de nombreuses simulations, Gosset arriva à la conclusion que cette approximation était 
valide seulement lorsque n est suffisamment grand (donc cela lui donnait l'indication comme quoi il 
devait y avoir quelque part derrière le théorème central limite). Il décida de déterminer l'origine de 
la distribution et après avoir suivi un cours de statistique avec Karl Pearson il obtint son fameux 
résultat qu'il publia sous le pseudonyme de Student. Ainsi, on appelle loi de Student la loi de 
probabilité qui aurait dû être appelée la loi ou fonction de Gosset. 


Signalons enfin que le test de Student est très utilisé pour identifier si des variations (progressions ou 
l'inverse) de la moyenne des chiffres de deux populations identiques sont significatives. C'est-à-dire que 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


464/4839 




















Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

si la taille de deux échantillons dépendants est identique alors nous pouvons créer le test suivant (nous 
avons indiqué tous les différents types d'écritures que l'on peut retrouver dans la littérature et dans les 
nombreux logiciels implémentant ce test): 


T{n - 1) = _ 


St-Jn S D /S S x,/V» 




1 1 'i 

-Z^-2—Z^l -*% 




(7.788) 


s D iS 




Avec: 


Sn — 




(7.789) 


La relation antéprécédente est donc très utile pour comparer deux fois le même échantillon dans des 
situations différentes de mesure (ventes avant ou après rabais d'un article par exemple). Cette dernière 
relation est appelée "test- T de deux moyennes d'échantillons appariés (ou échantillons dépendants)". 

Définition: Nous parlons "d'échantillons appariés" (par paires) si les échantillons de valeurs sont prises 
2 fois sur les mêmes individus (donc les valeurs des paires ne sont pas indépendantes, contrairement à 
deux échantillons pris indépendamment). 

8.5. TEST BINOMIAL EXACT 


Il arrive fréquemment lors de mesures que l'on souhaite comparer si deux échantillons de petite taille 
pris au hasard (sans remise!) d'une population elle aussi petite... sont significativement différents ou non 
alors que l'on attendait une égalité parfaite (50%/50%)! 

Il s'agit donc d'un test adapté aux cas suivants: 

- Savoir si un échantillon d'une population préfère utiliser une technique de travail plutôt qu'une autre 
alors que l'on s'attend à ce que la population utilise autant l'une que l'autre 

- Savoir si un échantillon d'une population a une caractéristique prédominante parmi deux possibilités 
alors que l'on s'attend à ce que la population soit parfaitement équilibrée. 

Avant d'aller plus en détails, rappelons qu'il faut être extrêmement prudent quant à la manière d'obtenir 
les deux échantillons. Il faut que l'expérience soit non biaisée, cela signifie pour rappel, que le protocole 
de tirage ne doit en aucun cas avantager l'une au l'autre des caractéristiques de la population (si vous 
étudiez l'équilibre homme/femme dans une population en attirant dans le sondage des personnes grâce à 
un cadeau sous la forme de bijoux vous aurez alors un échantillon biaisé... car vous aurez probablement 
naturellement plus de femmes que d'hommes...). 

Ceci étant dit, cette situation correspond donc à une loi binomiale pour laquelle nous avons démontré 
plus haut dans ce chapitre que la probabilité de k réussites pour une population de taille N dont la 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


465/4839 



















Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

probabilité de réussite est p (et la probabilité d'échec q donc de I -p) était donnée par la relation: 

PyN,k) = Cf p k q N ~ k = cj*p k (1 -pf~ k (7.790) 

Dans le cas qui nous intéresse, nous avons donc p = q = 0.5 : 

Pi N,k i = Cf 0.5*0.5*™ = 0.5 N Cj* (7791) 

tout en se rappelant que la distribution ne sera pas pour autant symétrique et ce surtout si la taille N de 
la population est petite. 

Si nous notons maintenant x le nombre de réussites (considéré comme la taille du premier échantillon) 
et y le nombre d'échecs (considéré comme la taille du deuxième échantillon), nous avons alors: 

P\N,k) = 0.5^ Cf = Pyx+y,k) = 0.5^ (7.792) 

Ceci étant fait, pour construire le test et de par l'asymétrie de la distribution, nous allons calculer la 
probabilité cumulée que k soit plus petit que le x obtenu par l'expérience et la sommer à la probabilité 
cumulée pour que k soit plus grand que le y obtenu par l'expérience (ce qui correspond à la probabilité 
cumulée des queues respectivement gauche et droite de la distribution). Cette somme correspond donc 
à la probabilité: 


P = 0.5^ £ Cf + 0.5^ £ Cf (7.793) 

.t=Ü k=y 

et cette dernière relation est appelée "test binomial exact (bilatéral)". 

Si la probabilité P obtenue pour la somme est au-dessus d'une certaine probabilité cumulée fixée à 
l'avance, nous dirons alors que la différence avec un échantillon tiré au hasard dans une population 
parfaitement équilibrée n'est pas significative (en bilatéral...) et respectivement si elle est en-dessous, la 
différence sera donc significative et nous rejetterons l'équilibre supposé. 

Ainsi, si: 


Ü.5^£ Cf+ 0.5*£cf 

fc=Ü k=y' 



(7.794) 


la différence par rapport à une population équilibrée sera considérée comme non significative. Souvent 
on prendra au maximum a comme valant 5% (mais rarement en-dessous) ce qui correspond donc à un 
intervalle de confiance de 95%. 


Malheureusement d'un logiciel de statistiques à l'autre les paramètres demandés ou les résultats obtenus 
ne seront pas nécessairement les mêmes (les tableurs n'intègrent pas de fonction spécifique pour le test 
binomial, il faudra souvent construire un tableau ou programmer soi-même la fonction). Par exemple, 
certains logiciels calculent systématiquement et imposent (ce qui est assez logique dans un sens...): 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


466/4839 








Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


/ 


0.5 


N 


*-1 


/ 

ï, .t=0 


cf + 


N 

Z ( 

k=y +1 


'tN 


=P 


(7.795) 


Exemple: 

D'une petite population ayant deux caractéristiques x et y particulières qui nous intéressaient et pour 
laquelle nous nous attendions à avoir un parfait équilibre tel que x = y nous avons en réalité obtenu 
x = 5 et y = 7 . Nous souhaiterions faire le calcul avec Microsoft Excel 11.8346 pour savoir si cette 
différence est significative ou non à un niveau de 5%? 


Pour répondre à cette question, nous allons donc calculer la probabilité cumulée 



( * 

N > 


( 5 

12 \ 

0.5 N 

Z-Cf 

+v cf 

- 0.5 12 

Z cf 

+ y d 2 









k=y < 


. ï :=0 

ifc=7 J 


ce qui nous donne: 


k 

Coeff binomial 

0 

1 

1 

12 

2 

66 

3 

220 

4 

495 

5 

792 

7 

792 

8 

495 

9 

220 

10 

66 

11 

12 

12 

1 

P 

0.774 


Figure: 7.36 - Valeurs du calcul des coefficients binomiaux dans Microsoft Excel 11.8346 


soit explicitement: 


£ 

Coeff binomial 

0 

=COMBIN(l 2;E12) 

1 

=COMBIN(l 2;E13) 

2 

=COMBIN(l 2;E14) 

3 

=COMBIN(l 2;E15) 

4 

=COMBIN(l 2;E16) 

5 

=COMBIN(l 2;E17) 

7 

=COMBIN(12;E18) 

8 

=COMBIN(l 2;E19) 

9 

=COMBIN(l 2;E20) 

10 

=COMBIN(12;E21) 

11 

=COMBIN(l 2;E22) 

12 

=COMBIN(l 2;E23) 

P 

=0.5 A 12*SOMME(F12:F23) 


Figure: 7.37 - Formules du calcul des coefficients binomiaux dans Microsoft Excel 11.8346 


donc la probabilité cumulée étant de 0.774 (soit 77.4%) la différence par rapport à une population 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


467/4839 














Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

équilibrée sera considérée donc comme non significative. 


Remarque : Ce test est également utilisé par la majorité des logiciels de statistiques (comme Minitab) 
pour donner un intervalle de confiance de la conformité d'opinions par rapport à celle d'un expert. 
C'est ce que nous appelons une étude R&R (reproductabilité & répétabilité) par attributs (voir mon 
livre sur Minitab pour un exemple). 


8.6.1.C. POUR UNE PROPORTION 


Indiquons que certains statisticiens utilisent le fait que la loi Normale découle de la loi de Poisson qui 
elle-même découle de la loi Binomiale (nous l'avons démontré lorsque n tend vers l'infini et que p et q 
sont du même ordre) pour faire un intervalle de confiance dans le cadre de l'analyse de proportions 
(très utilisé dans l'analyse de la qualité dans les industries). 

Pour voir cela, notons X i la variable aléatoire définie par: 


{ 1 si le i-ème élément de l'échantillon possède l'attribut A 
0 sinon 


(7.797) 


où l'attribut A peut être la propriété "défectueux" ou "non défectueux" par exemple pour une analyse 
de pièces. Nous noterons k le nombre de réussites de l'attribut A. 

La variable aléatoire X = X x + X 2 + ...+X n nous l'avons démontré au début de ce chapitre, suit une loi 
Binomiale de paramètres n et p avec les moments: 


pi — E(X) - n ■ p 

( 7 . 798 ) 

CT= *jV(X) = «Jn~p-q = -Jn-p- (1 - p) 

Ceci étant, nous ne connaissons pas la valeur vraie de p. Nous allons donc utiliser l'estimateur de la loi 
Binomiale démontré plus haut: 


„ k X 
P= — = — (7.799) 
n n 


D'après les propriétés de l'espérance nous avons alors: 


E(p) = 


As 



S(X) ftp 

-X—L = _ j _ = p (7.800) 
fl fl 


Et nous avons d’après les propriétés de la variance, la relation suivante pour la variance de la moyenne 
empirique de la proportion: 


f r (?)=oj=ri- 

\* J 


_ V(X) _ n 


(7.801) 


Ce qui nous amène alors à: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


468/4839 


















Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

= P et a-g = (7.802) 

V « 

Maintenant rappelons enfin que nous avons démontré que la loi Normale découlait de la loi Binomiale 
sous certaines conditions (les praticiens admettent que c'est applicable tant que «>50 et n ■ p > 5 ). 
Autrement dit, que la variable aléatoire X suivant une loi Binomiale suit une loi Normale sous certaines 
conditions. Évidemment, si X suit une loi Normale alors Xln aussi (et donc p ...). Dès lors nous pouvons 
centrer et réduire p afin qu'il se comporte comme la variable aléatoire centrée réduite notée Z: 

IpÇl-p) (7-803) 


Exemple: 

Si 5% de la production annuelle d'une entreprise est défectueuse, quelle est la probabilité qu'en prenant 
un échantillon de 75 pièces de la ligne de production que seulement 2% ou moins soit défectueux? 

Nous avons dès lors avec: 


0 O 2 -0.05 _ 11a 
|0.05- 0.95 (7-804) 

V 75 

La probabilité cumulée correspondante à cette valeur de la variable aléatoire est avec la version 
anglaise de Microsoft Excel 11.8346: 

=NORMSDIST(-1.19)= 11.66% 

Nous pouvons maintenant approximer l'intervalle de confiance pour la proportion en se basant sur la loi 
Binomiale et son comportement asymptotiquement normal dans les conditions démontrées lors de notre 
introduction de la loi Normale tel que: 


P-z, 


flf/2 


1 


P(\-p) 


<p<p+Z ai 2 


P(l-P) 


n 


(7.805) 


Avant de passer à un exemple, il est peut-être utile de préciser au lecteur que cette approximation par 
une loi Normale est très courante et que nous allons la rencontrer encore de nombreuse fois dans les 
démonstrations qui vons suivre. C'est tellement courant qu'on a même donné un nom à cette méthode...: 
la "méthode de Wald" (bon en réalité il y en en a plusieurs de méhtodes de Wald mais c'est la plus 
connue que nous utiliserons à chaque fois). 


Exemple: 

Prenons a = 3%, nous avons alors: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


469/4839 





















Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


P ~ "0.025 nr- — P — P + "0.025 ni- 


H .Jî±» s , s#+1 .«î0ia 


(7.806) 


n 


Sur une production de 300 éléments nous en avons trouvé 8 qui étaient défectueux. Quel est donc 
l'intervalle de confiance? 


Nous vérifions d'abord avec: 


P = 


8 

300 


2.66% (7.807) 


que: 


O 

n- p - 300 - = 8 > 5 (7.808) 

300 

Donc il est acceptable d'utiliser l'intervalle de confiance par la loi Normale. Nous avons dès lors: 


300 


—1.96 


I* 

/ 

8 ) 

1- 

J 300 

V 

300) 

\ 300 


< V < 


300 

0.84% <p< 4.49% 


+ 1.961 


8 

iQ 8 ^ 



300 

^ 300 J 

| 300 


(7.809) 


Pour clore ce sujet, nous pouvons évidemment nous intéresser aussi au nombre d'individus (taille 
d'échantillon) qu'il faut avoir pour satisfaire une certaine précision d'intervalle de confiance (imposé) en 
ayant un écart-type imposé. 

Nous avons donc selon les hypothèses susmentionnées et dans l'acceptation de l'approximation par une 
loi Normale que: 


Z = 



m -p) 


(7.810) 


Et en procédant de manière identique aux développements effectués plus haut avec la loi Normale, 
nous obtenons: 


~ zlnpQ-p) _ zjnM 

ô 2 5 2 


(7.811) 


dont nous prenons évidemment normalement la valeur entière supérieure dans la pratique... 

Une question qui revient souvent dans la pratique concerne le fait de savoir s'il faut prendre en 
unilatéral ou bilatéral. Au fait cela il n'y a pas de réponse précise, tout dépend de ce que nous 
cherchons à mettre en évidence. 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


470/4839 


































Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


Remarque : La taille de la population mère pour les relations développées plus haut n'entre pas en 
ligne de compte dans le calcul des intervalles de confiance ni dans celui de la taille de l'échantillon, 
et pour cause, elle est considérée infinie. Il faut donc faire attention à ne pas avoir parfois des tailles 
d'échantillons qui sont plus grandes que la population mère réelle possible... 


Exemple: 

Nous souhaiterions savoir le nombre d'individus (taille d'échantillon) à prendre d'un lot de production 
sachant que la proportion de défectueux est imposée à 30% avec une erreur tolérée d'environ 5% entre 
la proportion réelle et empirique et ce afin d'obtenir un intervalle de confiance à un niveau de 95% du 
résultat: 


Z« 30%(1 - 30%) 1.96- 30% -70% „ „ 

» = —-^-- =-=-= 165 (7.812) 

5% 2 5% 2 


Remarque : La dernière relation est très très souvent utilisée en théorie des sondages (analyses pour 
des votations avec réponses de type: Oui/Non) où parfois la taille de l'échantillon n est imposée 
pour des raisons de coûts du sondage et dont nous cherchons à calculer l'incertitude S et parfois 
l'inverse (l'incertitude est imposée et donc nous cherchons à connaître la taille de l'échantillon). 


8.6.1. TEST DE L'ÉGALITÉ DE DEUX PROPORTIONS 


Toujours dans le même contexte que l'approximation précédente de la loi Binomiale par une loi 
Normale, l'industrie (en particulier la biostatistique) est friande de comparer deux proportions de deux 
populations différentes afin de savoir si elles sont statistiquement égales ou non (autrement dit: 
significativement différentes ou pas). 

Dès lors rappelons que nous avons démontré la stabilité de la loi Normale si deux variables aléatoires 
étaient indépendantes et identiquement distribuées (selon une loi Normale donc!): 

X-Y = N\ i fi=fÀ x -{fy,a= J) (7.813) 

Dans le cadre des hypothèses susmentionnées il en est alors de même approximativement pour la 
différence de deux proportions: 


«1 « 2 


^-^r-ll a P I +a P T 


PX 


— py, jo^. + 

7 i Px Py 




= N 


PX ~PY’ i 


IP X'l-PX ' i PY'l-PY' 




«1 


«2 


(7.814) 


Dès lors nous savons que cette nouvelle variable centrée réduite suit une loi Normale selon: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


471/4839 



























Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


Z = 


(ZxzhlzJi 

, fr-Q-Py) 

«i n 2 


(7.815) 


et comme nous cherchons à savoir la probabilité cumulée que l'espérance théorique de la différence est 
nulle, cette dernière relation se réduit alors dans ce cas à: 


_ {Pjt-Py) _ 

Ipjt-G-Pjt) | Pr-<ï-P t) < 7 - 816 > 

V «1 *2 

Évidemment nous pouvons aussi construire (comme toujours...) un intervalle de confiance à partir de 
cette relation. 


Il semblerait cependant que cette dernière relation approximative serait d'après l'expérience plus 
correcte en prenant pour dénominateur: 


Z = 


(Px~Py) 


Px~Py 


\P-Q-P) | M ]zp} 


«i 




\p(y-p) 


1 1 j (7.817) 

— + — 

«2 


où p sera pris comme le mélange de deux populations. C'est-à-dire: 


somme du nombre d'évenements dans chacun des deux prélèvements 
somme du nombre d'échantillons 


(7.818) 


soit (en changeant la notations des indices des proportions expérimentales): 


«l + w 2^2 

«1 +«2 


(7.819) 


Ce test est aussi appelé "test Z de l'égalité de deux proportions" 

Exemple: 

Dans le cadre d'un plan d'échantillonnage (cf. chapitre de Génie Industrie ) nous avons prélevé sur un 
premier lot de 50 individus, 48 en parfait états. Dans un second lot de 30 individus, 26 étaient en bon 
état. 


Nous avons donc: 


p x = — = 96%, Py = — = 8 6.66% (7.820) 

50 30 

Nous souhaiterions donc savoir si la différence est significative avec une certitude de 95% ou 
simplement due au hasard. Nous utilisons alors: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


472/4839 

























Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


* «1 Pi + «2-?2 

P = -T- 

n l +n 2 


48 + 26 
50 + 30 


92.50% (7.821) 


et: 


Z== 



Px~Py 


(1 -P) 


fl l x 
—+ — 

\*1 «2 ) 


0.96-0.8 666 


0.925 -(1-0.925) 


'—+ — 

150 30 


1.535 

(7.822) 


Ce qui correspond à une probabilité cumulée en utilisant la version anglaise de 
Microsoft Excel 11.8346 de: 


=NORMSDIST(1.535)=93.77% 

Donc la différence est due au hasard (ceci dit c'est presque in extremis...). Autrement dit, elle n'est pas 
significative sous les contraintes énoncées. 

8.6.2. TEST DES SIGNES 

Nous mesurons quelque chose sur un échantillon puis, plus tard, nous mesurons la même chose sur ce 
même échantillon mais avec une autre méthode (donc il s'agit donc d'échantillons appariés!). Les deux 
classements ordonnées des mesures sont comparés et chaque observation est affectée d'un signe ("+" 
en cas d'élévation dans le classement, "-" en cas de descente). Celles qui restent au même niveau sont 
éliminées. 

Selon l'hypothèse à tester, il y a autant de "+" que de c'est-à-dire que la médiane de la distribution 
n'a pas bougé (cette affirmation peut ne pas paraître évidente à la première lecture il faut donc bien 
prendure du temps parfois pour réfléchir là-dessus). 

L'idée étant que pour chaque couple de valeurs, il n'y a que deux signes possibles de variations, nous 
avons une chance sur deux (50% de probabilité) que la différence soit positive ou négative. Ce test est 
donc basé uniquement sur l'étude des signes des différences observées entre les paires d'individus, 
quelles que soient les valeurs de ces différences. 

Nous pouvons souhaiter contrôler deux hypothèses: 

- L'inégalité des proportions de signes doit être significative. Donc l'un deux signes doit être en petit 
nombre par rapport à l'autre, ce qui correspond à un test unilatéral gauche (la probabilité cumulée 
d'avoir ce petit nombre de signes doit être inférieur à un niveau a donné). 

- La proportion des deux signes doit être faiblement déséquilibrée ( P(+) = P(-) = 0.5 ). Il s'agit donc 
dans ce cas d'un test en bilatéral (c'est le cas le plus courant) avec un certain niveau a donné. 

Pour pouvoir créer un tel test, nous allons considérons l'apparition des "+" et des comme un 
système de tirage aléatoire binaire dont l'ordre des succès n'est pas pris en compte (il s'agit donc d'une 
loi binomiale ou hypergéométrique) et avec remise (ce qui élimine d'emblée la loi hypergéométrique qui 
n'est pas symétrique et pose des problèmes d'utilisation dans la pratique...). Pour considérer un tirage 
aléatoire avec remise (alors qu'on ne fait pas réellement de remise), il faut que la population N soit 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


473/4839 
















Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

grande. Raison pour laquelle le test des signes considère que les valeurs appariées doivent être 
continues (ce qui permet in extenso d'approcher la loi hypergéométrique par la loi binomiale). 
Cependant certains logiciels de statistiques utilisent la loi hypergéométrique pour des soucis de 
précision. 


Remarque : Il faut savoir que la majorité des logiciels de statistiques, font implicitement l'hypothèses 
lors de ce test que les données sont continues et utilisent la loi binomiale. 


Exemple: 

Considérons deux séries de mesures avec deux méthodes différentes. Nous souhaiterions tester 
l'hypothèse avec un niveau a de 5% si la différence entre les deux méthodes est significative (nous 
nous attendons donc à une équilibre des signes). Il s'agit donc d'un test des signes à deux échantillons 
(sachant qu'il est possible de faire la même chose en comparant les valeurs d'un seul et unique 
échantillon à sa médiane). 

20.4, 25.4, 25.6, 25.6, 26.6, 28.6, 28.7, 29, 29.8, 30.5, 30.9, 31.1 
20.7, 26.3, 26.8, 28.1, 26.2, 27.3, 29.5, 32, 30.9, 32.3, 32.3, 31.7 

Nous avons donc les différences: 

-0.3, -0.9, -1.2, -2.5, 0.4, 1.3, -0.8, -3.0, -1.1, -1.8, -1.4, -0.6 


Soit: 


5555 ”^5 ”^5 5 5 5 5 5 

Bon il déjà clair que le résultat va être le rejet de l'hypothèse comme quoi il n'y pas de différence. Mais 
faisons quand même le calcul. Comme le test est en bilatéral à un niveau de 5%, la probabilité cumulée 
d'avoir obtenu au moins deux signes "+" ne doit pas être inférieure à 2.5% et pas supérieure à 97.5% si 
l'on veut accepter (ne pas rejeter) l'hypothèse comme quoi la différence n'est pas significative. 

Nous avons alors: 

2 2 2 

P> X < 2 i = T. ci * 2 0.5* 11 - 0.5' = T, c { 2 0.5*0.5 12- * = 0.5 12 T, c { 2 = 1.93% (7.823) 

fr =0 fc =0 fc =0 


Soit avec la version française de Microsoft Excel 14.0.6123: 

=LOI.BINOMIALE(2;12;0.5;1)=1.928% 

ou si nous faisons pas d'approximation en étant plus précis avec la loi hypergéométrique: 

=LOI.HYPERGEOMETRIQUE.N(2;24/2;12;24;VRAI)=0.17% 
ce qui n'est guère plus brillant... 

Donc la probabilité cumulée est inférieure à 2.5% et n'est de loin pas supérieure à 97.5%, nous rejetons 
l'hypothèse comme quoi la différence n'est pas significative. 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


474/4839 









Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

Nous pourrions accepter l'hypothèse si nous prenions pour a la valeur: 

p - value = 1.93% ■ 2 = 3.86% (7.824) 


mais bon ce n'est pas le cas! 

Enfin, pour ter min er concernant ce test des signes (test de la médiane), indiquons que certains logiciels 
de statistiques proposent un intervalle de confiance de la médiane basé sur la méthode de calcul 
exposée précédemment (intervalle de confiance d'une loi binomiale). Cependant, nous pensons qu'il 
vaudrait mieux favoriser le bootstrapping comme nous l'avons vu dans le chapitre de Méthodes 
Numériques, nous nous abstiendrons donc de présenter cette technique ici. De plus il est peut utile de 
préciser que certains font un approximation en loi Normale (comme avec la majorité des tests mais 
nous nous en abstiendrons dans le cas présent). 

8.6.3. TEST DE LA MÉDIANE DE MOOD 


Nous considérons deux échantillons indépendants i X\,..., X^ \ et ■ JJ,..., 7 h2 1 • Nous supposons que 

■ ' est un échantillon indépendant et identique distribué d'une loi continue F et (Jî.^2' 

est un échantillon indépendant et identiquement distribué d'une loi continue G. 

Après regroupement des «j + «2 valeurs des deux échantillons, k = • M n est le nombre 

d'observations X i qui sont supérieures à la médiane des N = r\ +«2 observations (la notation n'est pas 
géniale car elle peut faire croire à une multiplication mais bon...). 

Sous l'hypothèse nulle que les variables XetY suivent la même loi continue (c'est-à-dire G=F), la 
variable k = • M n peut prendre les valeurs 0,1,. ..,«1 selon la loi hypergéométrique: 


«1 ! 


«2 • 


C?C3U , k\\ru-k)\\Nll-kW\n 2 -sNn-k\\\ 

P\N,N!2,n [ ,k\= H /2 ~ k =---—— -- (7.825) 


n N 

Ü M2 


N\ 


N !2\y N- N i2'\ 


Dès lors, nous pouvons calculer la probabilité cumulée en unilatéral d'avoir k. Le test de Mood est donc 
un test purement unilatéral. 

Exemple: 

Considérons les deux échantillons: 

23.4, 24.4, 24.6, 24.9, 25.0, 26.2, 26.3, 26.8, 26.8, 26.9, 27.0, 27.6, 27.7 
22.5, 22.9, 23.7, 24, 24.4, 24.5, 25.3, 26, 26.2, 26.4, 26.7, 26.9, 27.4 
La médiane globale calculée avec Microsoft Excel 14.0.6123 est de 26.10. Nous avons au total: 

jfc = rt) ■ M„ = 8 (7.826) 

Il vient alors avec la version française de Microsoft Excel 14.0.6123: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


475/4839 










Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

=LOI.HYPERGEOMETRIQUE.N(8;26/2;13;26;VRAI)=94.24% 

Donc à un seuil de 5%, nous ne rejettons pas l'hypothèse nulle (mais bon étant proche de la limite c'est 
un peu périlleux de conclure cela...). Si nous faisons le même calcul avec la loi Binomiale nous 
obtenons: 


LOI.BINOMIALE.N(8;26/2;0.5;1)=86.65% 

Mais bien évidemment ici l'approximation ne s'applique pas puisque l'approximation par une loi 
binomiale est acceptable dans la pratique que lorsque l'échantillon est environ 10 fois plus petit que la 
population. 


Remarque : Il existe malheureusement plusieurs versions du test de Mood. Par exemple un logiciel 
comme Minitab compare à l'aide d'une table de contingence... le contingent de valeurs au-dessus ou 
en-dessous de la médiane et fait un simple test d'indépendance du Khi-deux (test de Pearson) vu 
dans le chapitre de Méthodes Numériques. 


8.6.4. TEST DE POISSON (1 ÉCHANTILLON) 

Nous savons qu'un certain nombre d'événements rares suivent une loi de Poisson. Nous pouvons alors 
nous permettre comme pour toute autre loi, de calculer la probabilité cumulée dans un intervalle donné 
(bilatéral ou unilatéral). 

Donc, si nous avons une variable aléatoire discrète suivant une loi de Poisson: 

fj' 

P =¥-'2-» (7.827) 

il 

Nous avons alors en unilatéral droite à un certain niveau de confiance a , la valeur de n de k la plus 
proche satisfaisant la condition: 


U 

Y — e M — >1— Of (7.828) 

- A-l 

fc=0 Æ! 


Donc pour trouver la valeur de n (entier strictement positif ou nul) il faudrait inverser la somme, ce qui 
est peu... pratique (raison pour laquelle aucun tableur à ce jour ne propose de fonction pour la loi de 
Poisson inverse). 

Maintenant, rappelons que nous avons vu dans le chapitre de Suites Et Séries, la série de Taylor 
(Maclaurin) avec reste intégral à l'ordre n -1 autour de 0 jusqu'à 2 suivante: 


M-l 

v 



À 

= 1-1 


1 


2 kn ~ l r< kf 2 


. x kn-i e -*n dx 


(7.829) 


Résultat que nous avions également donné sous la forme de fonctions pour la version française de 
Microsoft Excel 14.0.6123 pour que le lecteur puisse vérifier cette équivalence: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


476/4839 










Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

= LOI.POISSON.NO e N; VRAI) 

= 1 -L0I.KHIDEUX.N(2 V. 2 * (x +1); VRAI) 

Il vient alors que dans les tableurs, nous pouvons utiliser la loi du Khi-deux inverse pour calculer 
l'inverse de la loi de Poisson avec cette fois cependant une petite nuance: le résultat ne donnera pas 
nécessairement un nombre entier. 

Si par exemple nous prenons (toujours avec la version française de Microsoft Excel 14.0.6123): 

= 1 -LOI.KHIDEUX.N(2*20;2*( 15+1 );VRAI)=0.15 65 1 3 1 35 (7.831) 

La question est alors de trouver l'écriture pour l'inverse... Celle-ci est alors donnée par: 

=KHIDEUX.INVERSE( 1-0.156513135 ;2*20)/2= 15.53194258 (7.832) 

Finalement, l'écriture de l'inverse est assez naturelle. Ainsi, le "test de Poisson à 1 échantillon" à un 
niveau adonné en unilatéral droite peut s'écrire: 

k <KHIDEUX.INVERSE(l-alpha;2*(nombre de mesures+l))/2 (7.833) 

Soit formellement: 


^ < 2 \-a 1 ^ ■ {^imposé + 1 ) 1 (7 334 ) 

2 

Attention cependant à une chose! Il semblerait que certains logiciels de statistiques approximent parfois 
un peu abusivement la loi de Poisson par une loi Normale. Dès lors, l'intervalle unilatéral se calcule à 
partir de: 


V- X + Z 1 _ a 



(7.835) 


Mais avec la loi de Poisson, nous avons: 


Il vient alors: 


[A= U 1 = À 
X=Â 


(7.836) 


A <Â + Zi_ a 


*t 


V 


mpose 


n 


(7.837) 


Exemple: 

Une société fabrique des télévisions en quantité constante et a mesuré le nombre d'appareil défectueux 
produits chaque trimestre pendant les dix dernières années (donc 4 fois 10 mesures). La direction 
décide que le nombre maximum acceptable d'unités défectueuses est de 20 par trimestre et souhaite 
déterminer si l'usine satisfait à ces exigences (sous l'hypothèse que la distribution des défectueux suive 
une loi de Poisson) à un niveau de confiance de 5%. 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


477/4839 











Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

Les 40 mesures nous donnent une moyenne de: 

X=À = 17.825 ( 7 - 838 ) 


Nous avons alors avec l'approximation grossière: 


À 


<17.325+ 



( 7 . 839 ) 


Soit dans un tableur comme la version française de Microsoft Excel 14.0.6123: 


= LOI.NORM ALE. STANDARD ,EWERSE.N(1 -5%)*R.ACINE(20/40)+17.825 
= 18.988 


( 7 . 840 ) 


ou: 


À < ^~ 5% ' 2 ' (^ 0 +^) ' ( 7 . 841 ) 

2 

Soit dans un tableur comme la version française de Microsoft Excel 11.8346: 

= KHTOEUX.INVERSEC1 -5%; 2^20+l))/2 s 14.072 ( 7 . 842 ) 

Dans les deux cas, nous sommes en-dessous de la moyenne imposée de 20 (donc on rejette l'hypothèse 
nulle comme quoi le nombre de défauts est supérieur ou égal à 20). Bien évidemment, il est possible 
pour chacune des méthodes de déterminer quelle devrait être la probabilité cumulée (niveau de 
confiance) qui nous amène à la limite des 20 (donc la /évalue en d'autres termes). Avec la première 
méthode (approximation normale), la p-w alue est de 0.104%. 

Évidemment, dans le cas bilatéral, nous avons: 


Xa/2 1 2 ■ (« + 1 ) ' ^ ^ ' 2 ' (”+!) ' 

2 “ 2 


( 7 . 843 ) 


Exemple: 

Une compagnie d'aviation a eu 2 deux crashs en l'OOO'OOO de vols (événement très rare). Quelle est 
l'intervalle de confiance en bilatéral à 95% sachant qu'au niveau mondial le nombre d'accident par 
mi l li ons est de 0.4. 

Nous avons alors: 


Û* b/2'2(2 + 1)' ^ ^ 1 2 (2 + 1) I ^ 844) 

2 ~~ 2 

Soit pour la borne supérieure avec un tableur comme la version française de Microsoft Excel 11.8346: 

=LOI.KHIDEUX.INVERSE(l-5%/2;2*(2+l))/2=7.224 ( 7 . 845 ) 
et pour la borne inférieure: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


478/4839 













Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

=LOI.KHIDEUX.INVERSE( 1 -5%/2;2*(2+1 ))/2=0.618 ( 7 . 846 ) 

Donc statistiquement, cette compagnie d'avion est moins sûre que l'ensemble des compagnies. 

8.6.5. TEST DE POISSON (2 ÉCHANTILLONS) 

Nous venons de voir que: 

û .!2 ' 2 ■ (*» + 1 ) ' ^ t ^ 21 - o :/2 1 2 ■ (« + 1 ) ' (7 g47) 

2 - 2 

Or, en suivant le même raisonnement que celui qui nous a amené à construire les tests de comparaison 
des moyennes suivant: 


( x 2 -x,)-z„,2 -rt <( x 2 -x 1 )■+ z al2 püfï 


( 7 . 848 ) 




ou son équivalent avec la loi de Student quand l'écart-type vrai n'est pas connu et en utilisant le fait que 
nous avons démontré que la loi de Poisson est stable par l'addition (et donc aussi par la soustraction), 
que la loi de Gamma était aussi stable par l'addition (et donc aussi par la soustraction) et la loi du 
Khi-deux aussi puisque ce n'est qu'un cas particulier de la loi Gamma. Nous aurions tendance à écrire 
un peu vite: 


Ta/2 ' 20^2 +1) ~ 2(« t +1) 1 ^ ^ Tl-a/2' 2 ( w 2 + *) ~ 2 (”l +1 ) ' ( 7 . 349 ) 

2 ~ 2 A- 2 

Et au fait cela constitue un piège!! Car la loi du Khi-deux a un support qui est défini comme étant 
strictement positif et l'intervalle de confiance peut naturellement avoir la borne de gauche qui est 
négative. Une solution consiste alors à utiliser le test de la différence de deux proportions que nous 
avons déjà étudié plus haut: 


{Px-Py)-V 


Px O-Px) , Py 0 -Py) 

■\l 

1 

«1 n 2 


( 7 . 850 ) 


À condition bien évidemment que les conditions permettant d'approcher le test par une loi Normale 
soient satisfaites (les proportions doivent être inférieures typiquement à 0.1 et les n supérieurs à 50). 

Exemple: 

Une compagnie d'aviation a eu 2 deux crashs en l'OOO'OOO de vols (événement très rare). Une autre 
compagnie a eu 3 crashs en l'200'000 vols. Quel est l'intervalle de confiance en bilatéral à 95% en 
supposant que la différence est nulle. 

Les proportions sont respectivement: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


479/4839 

















Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


PX = — = 


«i l'OOO'OOO 


1 = 0.000002 et P Y = — = 


«2 l'200'000 


= 0.0000025 (7.851) 


Notons: 


A = p x -py = - 0.0000005 
4x Px 

<?y = 1 - Py 


Nous avons alors: 


1 A A A 


A V Px<?x PYOY s „ 

A _z 5%/2 J-+--A +z 5%/2 




(7.853) 


«1 « 2 K «1 «2 

ce qui donne un intervalle de confiance pour la différence de proportion théorique attendue: 

-0.000004461 < n < 0.000003461 (7.854) 


et donc comme -0.0000005 est dans cet intervalle, nous acceptons l'hypothèse comme quoi la 
différence des proportions n'est pas significative au seuil de 5%. 

Donc pour résumer un peu les convergences de lois dans tous ces différents tests et intervalles que nous 
avons vu jusqu'à maintenant, nous proposons au lecteur le schéma suivant qui clarifiera peut-être plus 
ou moins bien les choses: 



Figure: 7.38 


Convergence des différentes lois usuelles en inférence statistique élémentaire 


Et aussi ce tableau où toutes les relations ont été démontrées en détail plus haut et certains déjà 
utilisées (d'autres le seront plus loin): 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


480/4839 






























Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


Statistique d'échantillonnage 

Moyenne 

[Écart-type 


de la statistique 

de la statistique 

Moyenne 

U 

a 

(population infinie) 

-sftt 

Moyenne 

f 

cr \N-n 

(population finie) 


1 

Proportion 

P 

tpi.\-p 1 

(population finie) 


» 

Proportion 

P 

jp<l-p< jN-n 

(population infinie) 


V n Vtf-1 

ô 2 

(population infinie*) 

"- 1 a 2 
n 

/ 2 1 72 — 1 I t 


Tableau: 7.11 - Tableau des statistiques d'échantillonnage démontrées et utilisées en partie jusqu'à maintenant 


*: Pour autant que la population parente soit distribuée normalement. 

9. INTERVALLE DE CONFIANCE/TOLÉRANCE/PRÉDICTION 


Nous allons ici, afin d'éviter une confusion fréquente et avant de passer à d'autres sujets plus 
complexes, comparer l'intervalle de confiance, l'intervalle de tolérance (souvent appelé "intervalle de 
fluctuation" dans certains programmes scolaires) et enfin l'intervalle de prédiction. 

Définitions: 

Dl. "L'intervalle de tolérance" (ou "intervalle de fluctuation") est un intervalle contenant un certain 
pourcentage (souvent 68.26, 95.44 ou 99.73%) des individus d'une population de mesures. 

D2. "L'intervalle de confiance" pour un échantillon de moyenne x contient l'intervalle de valeur à un 
niveau de confiance donné (souvent 90, 95 ou 99%) de l'espérance A (moyenne vraie) de la 
population. 

D3. "L'intervalle de prédiction" permet de déterminer un intervalle d'un valeur individuelle basée sur la 
connaissance de la moyenne échantillonnale et de l'écart-type de la population. 

Un exemple valant mieux assez souvent mieux que mille mots, prenons le cas où la moyenne et 
l'écart-type de prix de 49 DVD sont: 

X = 31.5531 S = & = 0.7992 (7.855) 


Nous avons alors: 


[X±tf] = [30.8,32.4] 

[X± 2Sf] = [30.0,33.2] (7.856) 

[X±3£] = [29.2,34.2] 

correspondant respectivement à des intervalles de tolérance selon une loi Normale de 68.26, 95.44 et 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


481/4839 































Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


99.73%. 

Par contre, un intervalle de confiance à 95% basé sur la relation démontrée plus haut: 

X--?=T a!2 (n-ï)<v<X + -?=T a!2 (n-î) ( 7 . 857 ) 


Do nn e: 


31.32 31.78 ( 7 . 858 ) 


Donc 95% de probabilité cumulée que la moyenne vraie (espérance) se trouve comprise entre 31.32 et 
31.78. 



E- 

29.2 


Pris 

E - 

30. S 


H - 

32,4 


E- 

30.0 


-3 - 

33.2 


E — 3 — 

31.32 31.78 


Intervalle de tolérance 

-► estimée pour le prix à 

63.26% de tous les DVD 

_Intervalle de tolérance 

estimée pour le prix à 
95.44% de tous les DVD 
Intervalle de tolérance 
34.0 estimée pour le prix à 
99.73% de tous les DVD 

-►Intervalle de confiance de 

l'espérance (à 95%) de la 
population des DVD 


Histogramme de l'échantillon des prix de 49 DVD 


Maintenant passe à une notion qui curieusement est rarement traitée dans les ouvrages de statistiques. 
L'idée de l'intervalle de prédiction est de plutôt que de s'intéresser à l'intervalle de confiance de 
l'espérance basé sur une moyenne expérimentale, d'utiliser cette moyenne expérimentale 
(échantillonnale) comme base pour prévoir l'intervalle d'une unique valeur (et non d'une moyenne!). 


Nous allons donc nous intéresser à la différence entre la moyenne et une valeur ponctuelle: 


x-x ( 7 . 859 ) 

que nous supposerons proche de zéro (il vaut mieux pour avoir un produit fiable et passer les tests 
d'autorisation des ventes). Concernant la variance, ce qui nous intéresse ce n'est plus simplement 
l'écart-type de la moyenne mais l'écart-type de la différence... et comme l'échantillon est indépendant 
de la valeur unique nous avons: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


482/4839 






























Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


o 2 


4 -, = 4 +^=— +o 3 = o 3 (i+-] (’■*«» 

fl V fl J 


Donc nous pouvons écrire qu’en première approximation: 


Z = 


x - x x - x 


x - x 


x-x 


a 2 


(l + fl 

«J 


O-, 


H 


(7.861) 


Et bien évidemment suite à ce que nous avons vu: 


Tin- lis- 


x-x 


S. 


f, + I) 

n) 


(7.862) 


Et donc in extenso nous pouvons construire l'intervalle de prédiction: 




(7.863) 


10. LOI FAIBLE DES GRANDS NOMBRES 


Nous allons maintenant nous attarder sur une relation très intéressante en statistiques qui permet 
pas mal de choses tout en ayant peu de données et ce quelle que soit la loi considérée (ce qui est 
mal quand même!). C'est une propriété très utilisée en simulation statistique par exemple dans le 
de l'utilisation de Monte-Carlo. 

Soit une variable aléatoire à valeurs dans jg+. Alors nous allons démontrer la relation suivante appelée 
"inégalité de Markov": 


de dire 

pas 

cadre 


VA > 0: P(X> A) < 


S(X) 

A 


(7.864) 


avec S(X) < A dans le contexte particulier des probabilités. 

En d'autres termes, nous proposons de démontrer que la probabilité qu'une variable aléatoire soit plus 
grande ou égale qu'une valeur A est inférieure ou égale à son espérance divisée par la valeur 
considérée A et ce quelle que soit la loi de distribution de la variable aléatoire X] 

Démonstration: 

Notons les valeurs de X par {xj,..., , où 0 < x 2 < x 2 <... < x n (c'est-à-dire triées par ordre croissant) 

et posons x 0 = 0 . Nous remarquons d'abord que l'inégalité est triviale au cas où A > x n > 0 . 
Effectivement, comme X ne peut être compris qu'entre 0 et x n par définition alors la probabilité qu'il 
soit supérieur à x n est nulle. En d'autres termes: 

P(X > A) = 0 (7.865) 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


483/4839 


























Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

et X étant positif, E(X) l'est aussi, d'où l'inégalité pour ce cas particulier dans un premier temps. 

Sinon, nous avons 0 < A < x n et il existe alors un k e tel que x k _ Y < A< x k . Donc: 

£(■^0 = £ XiPi ^ ^Pi - ^ = À P i X - À ) (7 - 866) 

2=1 i=k 2'=.5- 

nC.Q.F.D. 


Exemple: 

Nous supposons que le nombre de pièces sortant d'une usine donnée en l'espace d'une semaine est une 
variable aléatoire d'espérance 50. Si nous souhaitons estimer la probabilité cumulée que la production 
dépasse 75 pièces nous appliquerons simplement: 

P(X > 75) < = — = 0.6666 = 66.66% (7.867) 

A 15 

Considérons maintenant une sorte de généralisation de cette inégalité appelée "inégalité de Bienaymé- 
Tchebychev" (abrégée "inégalité BT") qui va nous permettre d'obtenir un résultat très très très 
intéressant et important un peu plus bas. 

Considérons une variable aléatoire X. Alors nous allons démontrer l'inégalité de Bienaymé- 
Tchebychev suivante: 


Ve > 0 : P(\X-E{X)\> £■) < 



(7.868) 


qui exprime le fait que plus l'écart-type est petit, plus la probabilité que la variable aléatoire X s'éloigne 
de son espérance est faible. 

Démonstration: 

Nous obtenons cette inégalité en écrivant d'abord: 


V e > 0 : P (\X - E(X )| > e) = P^X - E(X)f > e 2 ) (7.869) 


où le choix du carré va nous servir pour une simplification future. 

Puis en appliquant l'inégalité de Markov (comme quoi c'est quand même utile...) à la variable aléatoire 
Y = [X- E(X)] 2 avec A = s 2 ü y i en t automatiquement: 

F(7> s 2 ) = pf i [X-E(X)f > <^p- = — 5 ^ (7 ' 870) 


Ensuite, en utilisant la définition de la variance: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


484/4839 











Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

e{[X-E(X)] 2 } = e[[x -^] 2 ) = V{X) = o 2 (7.871) 


Nous obtenons bien: 


P(Y> e 2 ) 


^E{[X-E(X)f} 


nx) 

P 


^ (7.872) 

e 2 


□C.Q.F.D. 


Si nous posons: 


£■=*0- (7.873) 


l'inégalité s'écrit aussi: 


P(\X-E(X)\ïtcr)<j 


(7.874) 


et exprime que la probabilité qu'afin que X s'éloigne de son espérance de plus que t fois son écart-type, 
est inférieure à \jt 2 . Il y a, en particulier, moins de 1 chance sur 9 pour que X s'éloigne de son 
espérance de plus de trois fois l'écart-type. 


Exemple: 

Nous reprenons l'exemple où le nombre de pièces sortant d'une usine donnée en l'espace d'une semaine 
est une variable aléatoire d'espérance 50. Nous supposons en plus que la variance de la production 
hebdomadaire est de 25. Nous cherchons à calculer la probabilité que la production de la semaine 
prochaine soit comprise entre 40 et 60 pièces. 


Pour calculer ceci il faut d'abord se souvenir que l'inégalité de BT est basée en parties sur le terme 
\X - donc nous avons: 


|40 — 50|= |60 — 50| = 10 (7.875) 

donc l'inégalité de BT nous permet bien de travailler sur des intervalles égaux en valeur absolue ce qui 
s'écrit aussi: 


-\0<X-E(X) <10 (7.876) 

Ensuite, ne reste plus qu'à appliquer simplement l'inégalité numériquement: 

P[\X -E{X )\> e) = P{\X - E(X )| >10) = = -^ = 0.25 = 25% (7.877) 

Ces deux dernières inégalités vont nous permettre d'obtenir une relation très importante et puissante 
que nous appelons la "loi faible des grands nombres" (L.EG.N.) ou encore "théorème de Khintchine". 

Considérons une variable aléatoire X admettant une variance et ( X n ) ngN une suite de variables 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


485/4839 











Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 

aléatoires indépendantes (donc non corrélées deux-deux) de même loi que X et ayant toutes les mêmes 
espérances H et les mêmes écarts-types a. 

Ce que nous allons montrer est que si nous mesurons une même quantité aléatoire X n de même loi au 
cours d'une suite d'expériences indépendantes (alors dans ce cas, nous disons techniquement que la 
suite ( X n ) ^ de variables aléatoires est définie sur le même espace probabilisé), alors la moyenne 

arithmétique des valeurs observées va se stabiliser sur l'espérance de X quand le nombre de mesures est 
infiniment élevé. 


De manière formelle ceci s'exprime sous la forme: 


/ 

(\JL ) 



a 2 

\f£>0,P 


-u 

> £ 


\ 

\* 3=1 J 


J 

fl£- 


(7.878) 


lorsque n —> +00 c'est cela le résultat très important dont nous faisions mention plus haut! L'estimateur 
empirique de la moyenne tend donc pour toute loi vers l'espérance vraie si n est grand! Donc de par la 
même nous assurons que la moyenne empirique est un estimateur convergent de l'espérance! Ce 
résultat (assez intuitif) est parfois appelé "théorème fondamental de Monte Carlo" car il est au centre 
du principe des simulations du même nom (cf. chapitre de Méthodes Numériques) qui ont une 
importance cruciale dans l'étude des statistiques avancées. 

Donc en d'autres termes la probabilité cumulée que la différence entre la moyenne arithmétique et 
l'espérance des variables aléatoires observées soit comprise dans un intervalle autour de la moyenne 
tend vers zéro quand le nombre de variables aléatoires mesurées tend vers l'infini (ce qui est finalement 
intuitif). 

Ce résultat nous permet d'estimer l'espérance mathématique en utilisant la moyenne empirique 
(arithmétique) calculée sur un très grand nombre d'expériences. 

Démonstration: 

Nous utilisons l'inégalité de Bienaymé-Tchebychev pour la variable aléatoire (cette relation s'interprète 
difficilement mais permet d'avoir le résultat escompté): 

Y=~y\X i (7.879) 

*3=1 

Et nous calculons d'abord en utilisant les propriétés mathématiques de l'espérance que nous avions 
démontrées plus haut: 


E(Y) = E 


1 ™ 
~X x t 
!-i y 


\ 1 {« 


= -E 

fl 


Z x i } = -Z5C^) = -Za=-^=-w ( 7 - 88 °) 


\ 2=1 / 


fl 


2=1 


2=1 


et dans un deuxième temps en utilisant les propriétés mathématiques de la variance aussi déjà 
démontrées plus haut: 


[Vincent ISOZ] | http://www.sciences.ch] | Page: 


486/4839 


















Vincent ISOZ [v3.0-2013] 


[SCIENCES.CH] 


V{Y) = V 

2 


/ h » \ i /h \ 

« 


1 " 
-Z x i 

\ K i =1 y 


2^ 

v i=i y 


(7.881) 


W 


Z^)+ 2 2 covcx,,^) 

V 2=1 


et puisque nous avons supposé les variables non corrélées entre elles alors la covariance est nulle dès 
lors: 


viX) = \ 


n 


2 nxù 

\i=i y 


\ ! { _\ 


T'a 2 = —rna 2 = —a 2 (7.882) 

V;=i J » « 


Donc en injectant cela dans l'inégalité BT: 


P^X-E{X)f > e 2 J < 


V(X) 


(7.883) 


nous avons alors: 


P^Y-E{Y)f > ? 2 ) < 


V(Y) 


(7.884) 


qui devient: 


/ 

1 

'm» 

_-■■■ 


2 > 

P 

-u 

IV 

r T 

\ 

.V" !=i y